خطای پوشش

از ویکیپدیا، دانشنامه آزاد
پرش به ناوبری پرش به جستجو
همه دایره های رنگی در جمعیت هدف گنجانده شده است. دایره های سبز و نارنجی رنگ در قاب نمونه گنجانده شده است. دایره های سبز رنگ نمونه ای هستند که به طور تصادفی از قاب نمونه تولید می شوند. قاب نمونه شامل پوشش بیش از حد است زیرا جان و جک یک نفر هستند، اما او بیش از یک بار در کادر نمونه گنجانده شده است. چارچوب نمونه شامل زیرپوشش است زیرا تمام جمعیت هدف در چارچوب نمونه گنجانده نشده است.

خطای پوشش نوعی خطای غیر نمونه گیری [1] است که زمانی رخ می دهد که یک تناظر یک به یک بین جامعه هدف و چارچوب نمونه برداری که از آن نمونه گرفته می شود وجود نداشته باشد. [2] این می تواند تخمین های محاسبه شده با استفاده از داده های نظرسنجی را سوگیری کند. [3] برای مثال، یک محقق ممکن است بخواهد نظرات رای دهندگان ثبت نام شده (جمعیت هدف) را با تماس با محل سکونت فهرست شده در فهرست تلفن (فریم نمونه) مطالعه کند. اگر همه رای دهندگان در فهرست تلفن ذکر نشده باشند، ممکن است پنهان کاری رخ دهد. اگر برخی از رای دهندگان بیش از یک شماره تلفن فهرست شده داشته باشند، پوشش بیش از حد ممکن است رخ دهد. اگر برخی از شماره‌های تلفن فهرست‌شده در فهرست به رای‌دهندگان ثبت‌شده تعلق نداشته باشند، ممکن است سوگیری رخ دهد. [4] در این مثال، عدم پوشش، پوشش بیش از حد و سوگیری به دلیل درج رای دهندگان ثبت نام نشده در چارچوب نمونه گیری، نمونه هایی از خطای پوشش هستند.

بحث

خطای پوشش یکی از انواع خطاهای نظرسنجی کل است که می تواند در نمونه گیری نظرسنجی رخ دهد . در نمونه‌گیری پیمایشی، چارچوب نمونه‌گیری فهرستی از واحدهای نمونه‌گیری است که نمونه‌های یک جامعه هدف از آن‌ها استخراج می‌شود. [3] خطای پوشش زمانی حاصل می شود که بین جامعه هدف و چارچوب نمونه تفاوت وجود داشته باشد. [5]

به عنوان مثال، فرض کنید یک محقق از توییتر برای تعیین نظر رأی دهندگان آمریکایی در مورد اقدام اخیر رئیس جمهور ایالات متحده استفاده می کند. اگرچه جامعه هدف این محقق رای دهندگان آمریکایی هستند، اما او از فهرستی از کاربران توییتر به عنوان چارچوب نمونه گیری خود استفاده می کند. از آنجایی که همه رای دهندگان کاربر توییتر نیستند، و از آنجا که همه کاربران توییتر رای دهنده نیستند، بین جامعه هدف و چارچوب نمونه گیری نادرستی وجود خواهد داشت که می تواند منجر به نتایج نظرسنجی مغرضانه شود، زیرا ممکن است جمعیت شناسی و نظرات توییتر که از رای دهندگان استفاده می کند نماینده نباشد. از جمعیت هدف رای دهندگان [4]

عدم پوشش زمانی رخ می دهد که چارچوب نمونه گیری شامل همه اعضای جامعه هدف نباشد. در مثال قبلی، رای دهندگان مخفی هستند زیرا همه رای دهندگان کاربر توییتر نیستند. از سوی دیگر، پوشش بیش از حد زمانی حاصل می شود که برخی از اعضای جامعه هدف بیش از حد در چارچوب نمونه گیری حضور داشته باشند. در مثال قبلی، این امکان وجود دارد که برخی از کاربران بیش از یک حساب توییتر داشته باشند و بیشتر از کاربران توییتر با تنها یک حساب، در نظرسنجی شرکت کنند. [4]

مطالعات طولی به ویژه مستعد پوشش نادرست هستند، زیرا جمعیت مورد مطالعه در یک بررسی طولی می تواند در طول زمان تغییر کند. [6] برای مثال، یک محقق ممکن است بخواهد رابطه بین نمرات نامه‌ای که دانش‌آموزان کلاس سوم در یک منطقه مدرسه خاص دریافت می‌کنند و دستمزدی که همین کودکان در بزرگسالی دریافت می‌کنند، مطالعه کند. در این مورد، محقق به تمام دانش‌آموزان کلاس سوم منطقه که بالغ می‌شوند (جمعیت هدف) علاقه‌مند است. چارچوب نمونه گیری او ممکن است لیستی از دانش آموزان کلاس سوم در منطقه مدرسه باشد (قاب نمونه گیری). با گذشت زمان، این احتمال وجود دارد که محقق ردیابی برخی از کودکان مورد استفاده در مطالعه اصلی را گم کند، به طوری که چارچوب نمونه بزرگسالان او دیگر با چارچوب نمونه کودکان مورد استفاده در مطالعه مطابقت ندارد.

روش های کمی سازی خطای پوشش

روش های مختلفی برای تعیین کمیت و تصحیح خطای پوشش استفاده شده است. اغلب، روش های به کار گرفته شده برای سازمان ها و سازمان های خاص منحصر به فرد است. به عنوان مثال، اداره سرشماری ایالات متحده مدل هایی را با استفاده از فایل توالی تحویل خدمات پستی ایالات متحده، داده های آدرس IRS 1040، شمارش سلب مالکیت در دسترس تجاری و سایر داده ها برای توسعه مدل هایی ایجاد کرده است که قادر به پیش بینی تعداد کم بر اساس بلوک سرشماری هستند. اداره سرشماری موفقیت آمیز بودن چنین مدل‌هایی را با توزیع‌های دوجمله‌ای بادی صفر یا پواسون با باد صفر (ZIP) گزارش کرده است. [7]

روش دیگری برای کمی کردن خطای پوشش از روش علامت گذاری و بازپس گیری استفاده می کند. [8] در روش علامت گذاری و بازپس گیری، یک نمونه مستقیماً از جامعه گرفته می شود، علامت گذاری می شود و مجدداً به جامعه معرفی می شود. در تاریخ بعدی، نمونه دیگری از جامعه گرفته می‌شود (بازگیری)، و نسبت نمونه‌های علامت‌گذاری‌شده قبلی برای تخمین اندازه واقعی جمعیت استفاده می‌شود. این روش را می‌توان به تعیین اعتبار یک چارچوب نمونه‌گیری با نمونه‌گیری مستقیم از جامعه هدف و سپس گرفتن نمونه دیگری از چارچوب داده به منظور برآورد زیرپوشش تعمیم داد. [9] مثلاً فرض کنید سرشماری انجام شد. پس از اتمام سرشماری، نمونه‌های تصادفی از قاب می‌توان برای شمارش مجدد برداشت کرد.[8]

راه های کاهش خطای پوشش

یکی از راه‌های کاهش خطای پوشش، تکیه بر منابع متعدد برای ساختن یک قاب نمونه یا درخواست اطلاعات است. این رویکرد حالت ترکیبی نامیده می شود. برای مثال، دانشجویان دانشگاه ایالتی واشنگتن، نظرسنجی‌های تجربه نظرسنجی دانشجویی را با ساختن یک چارچوب نمونه با استفاده از آدرس خیابان و آدرس ایمیل انجام دادند. [5]

در مثال دیگری از رویکرد ترکیبی، سرشماری سال 2010 ایالات متحده عمدتاً بر پاسخ‌های نامه‌های مسکونی تکیه کرد و سپس مصاحبه‌گران میدانی را برای مصاحبه با افرادی که پاسخگو نبودند مستقر کرد. به این ترتیب، مصاحبه‌کنندگان میدانی می‌توانستند تعیین کنند که آیا آدرس خاص هنوز وجود دارد یا نه. این رویکرد مزیت اضافی کاهش هزینه را داشت زیرا اکثر مردم از طریق پست پاسخ دادند و نیازی به بازدید میدانی نداشتند. [8] [5]

مثال: سرشماری 2010

اداره سرشماری ایالات متحده یک فایل آدرس اصلی از حدود 144.9 میلیون آدرس را تهیه و نگهداری می کند که به عنوان یک چارچوب نمونه برای سرشماری ده ساله ایالات متحده و سایر نظرسنجی ها استفاده می کند. با وجود تلاش های حدود 111105 نماینده میدانی و هزینه ای نزدیک به نیم میلیارد دلار، اداره سرشماری همچنان تعداد قابل توجهی از آدرس ها را پیدا کرد که به فایل آدرس اصلی راه پیدا نکرده بودند. [7]

پیگیری پوشش (CFU) و راستی‌آزمایی میدانی (FV) عملیات‌های اداره سرشماری بودند که برای بهبود سرشماری سال 2010 با استفاده از داده‌های سرشماری 2000 به عنوان پایه انجام شدند. این عملیات برای رسیدگی به انواع خطاهای پوشش زیر در نظر گرفته شده بود: عدم شمارش فردی که باید شمارش می شد. شمردن کسی که نباید شمارش می شد. و شمارش فردی که باید شمارش می شد، اما مکان شناسایی اش اشتباه بود. خطاهای پوشش در سرشماری ایالات متحده تأثیر بالقوه ای دارد که اجازه می دهد گروه های مردمی توسط دولت کمتر نمایندگی شوند. نگرانی ویژه «عدم شمارش متفاوت» است که دست کم گرفته شده از گروه های جمعیتی هدف است. اگرچه تلاش‌های CFU و FV دقت سرشماری 2010 را بهبود بخشید، مطالعات بیشتری برای پرداختن به سؤال کم‌شمارهای تفاضلی توصیه شد.

همچنین ببینید

منابع

  1. سالانت، پریسیلا و دان آ. دیلمن. "چگونه نظرسنجی خود را انجام دهید: متخصصان پیشرو تکنیک های اثبات شده ای را برای دریافت نتایج قابل اعتماد به شما ارائه می دهند." (1995)
  2. ^ شیلات، NOAA (2019-02-21). "بررسی اجمالی آمارهای نظرسنجی | شیلات NOAA" . www.fisheries.noaa.gov . بازیابی شده در 2019-02-24 .
  3. ^ a b Scheaffer، Richard L. 1996. بخش 5 از نمونه گیری نظرسنجی تدریس، توسط رونالد اس. فکسو، ویلیام دی. کالسبیک، شارون ال. لور ، ریچارد ال. شیفر، فریتز جی. Scheuren، الیزابت A. Stasny. The American Statistician 50:4 (Nov. 1996), pp 335-337. (در jstor )
  4. ^ a b c Scheaffer, Richard L. (2012). نمونه گیری پیمایشی ابتدایی (هفتم، ویرایش دانش آموز). بوستون، MA: بروکس/کول. شابک 978-0840053619. OCLC  732960076 .
  5. ^ a b c Dillman, Don A.; اسمیت، جولین دی. کریستین، لیا ملانی (6 اوت 2014). نظرسنجی های اینترنت، تلفن، پست و حالت مختلط: روش طراحی مناسب (ویرایش چهارم). هوبوکن. شابک 9781118921302. OCLC  878301194 .
  6. لین، پیتر (2009). روش شناسی بررسی های طولی . چیچستر، بریتانیا: جان وایلی و پسران. شابک 9780470743911. OCLC  317116422 .
  7. ^ a b دفتر، سرشماری ایالات متحده. "انتخاب پیش بینی کننده ها برای مدل سازی خطاهای پوشش" . www.census.gov . بازیابی شده در 2019-02-24 .
  8. ^ a b c Biemer, Paul P.; د لیو، ادیت دزیره؛ اکمن، استفانی؛ ادواردز، براد؛ کروتر، فراوکه; لیبرگ، لارس، ویراستاران. (6 فوریه 2017). کل خطای نظرسنجی در عمل هوبوکن، نیوجرسی شابک 9781119041689. OCLC  971891428 .
  9. ^ دفتر، سرشماری ایالات متحده. "مدل های خطای پوشش برای داده های سرشماری و بررسی" . www.census.gov . بازیابی شده در 2019-02-24 .
  10. ^ سرشماری 2010: پیگیری باید خطاهای پوشش را کاهش دهد، اما اثرات آن بر گروه های جمعیتی باید مشخص شود: گزارش به درخواست کنندگان کنگره . دولت آمریکا دفتر پاسخگویی 2010. OCLC 721261877 .