یادداشت‌ها

مغالطه‌ها و فریب‌های آماری/بخش ۱-۱: سوگیری خود-انتخاب‌گری

فریب‌های آماری*

فرض کنید در محل کارتان شماره‌ای ناشناس با موبایل شما تماس می‌گیرد. صدایی آرام و شمرده از آن طرف خط می‌گوید من از طرف موسسه نظرسنجی حقیقت‌پردازان به صورت تصادفی با شما تماس می‌گیرم تا از شما بخواهم در یک پیمایش درباره نظام جمهوری اسلامی شرکت کنید. نیازی نیست خود را معرفی کنید، و در ضمن شماره تلفن شما نزد ما محرمانه محفوظ خواهد ماند. همچنین مختارید که در نظرسنجی شرکت نکنید یا هر پرسشی که دوست نداشتید را پاسخ ندهید. شما چه می‌کنید؟ در همین مرحله احتمالش زیاد است که اگر یکی از مخالفان جدی نظام جمهوری اسلامی هستید و از فاش شدن موضع و افکار خود به هر دلیل (مثلا ترس از تنبیه شدن توسط عوامل نظام) پرهیز می‌کنید در نظرسنجی شرکت نکنید و تماس را قطع کنید.

اما فرض کنیم شما بعد از کمی گفتگو قانع شوید در پیمایش شرکت کنید. در میان نظرسنجی فرض کنید یکی از پرسش‌ها این باشد که آیا موافقید نظام جمهوری اسلامی باید براندازی شود؟ اگر شما موافق براندازی و به گفتن حقیقت وفادار باشید احتمال خیلی خیلی زیاد این پرسش را پاسخ نمی‌دهید چون خیلی بعید است که یک فرد عاقل پشت تلفن به یک غریبه در کشور ایران بگوید که موافق براندازی نظام است. این کار شما یک سوگیری در آن نظرسنجی به‌وجود می‌آورد چون پاسخ ندادن افرادی چون شما، عملا تعداد کسانی که مخالف براندازی هستند را در نمونه آماری زیاد می‌کند.

از نظر آماری اینکه افراد جامعه‌ی نمونه بتوانند مشارکت خود در مطالعه یا حتی پرسش‌هایی که پاسخ می‌دهید را انتخاب کنند و این تصمیم بر روی نتیجه مطالعه اثر بگذارد، باعث یک سوگیری می‌شود که آن را سوگیری خود-انتخاب‌گری (self-selection bias) می‌نامند. مثلا اگر قرار باشد یک پیمایش درباره تنبیه فیزیکی کودکان توسط والدین انجام شود، و اگر افراد نمونه آماری قدرت انتخاب داشته باشند که در مطالعه شرکت کنند یا نه، به احتمال خیلی زیاد والدینی که کودکان خود را تنبیه می‌کنند در مطالعه شرکت نخواهند کرد چون نمی‌خواهند آبرویشان برود یا در دردسر بیافتند. در نتیجه، آن پژوهش، به نفع والدینی که کودکان خود را کتک نمی‌زنند سو می‌گیرد. در چنین مطالعه‌ای، نمونه نماینده‌ی خوبی برای جامعه‌ی آماری نیست و نتایج آن مشخصات آماری جامعه را به‌درستی شرح نمی‌دهد. این همان سوگیری خود-انتخاب‌گری است که در نمونه‌برداری مطالعات آماری رخ می‌دهد.

تقریبا در تمام مطالعات آماری، چون جامعه‌ی مورد مطالعه بسیار بزرگ است، همیشه به‌جای مطالعه‌ی اعضای جامعه از آن نمونه می‌گیرند و آن نمونه را بررسی می‌کنند. روش نمونه‌گیری بسیار اهمیت دارد و در حالت ایده‌آل باید انتخاب اعضای نمونه کاملا تصادفی باشد. اما وقتی اعضای نمونه توانایی این را دارند که در صورت انتخاب برای مطالعه در آن شرکت نکند، این یعنی نمونه سوگیری دارد. در بسیاری از مطالعات امروزه، به دلایل قانونی و اخلاقی، نمی‌توان کسی را مجبور کرد که در پژوهش شرکت کند و همین می‌تواند سرچشمه‌ی سوگیری و در نهایت خطا یا فریب‌کاری در نتایج شود. برای یافتن و اصلاح این سوگیری روش‌هاش آماری خاصی وجود دارد که موضوع این مقاله نیست. امر مسلم این است که اگر بدون اصلاح این سوگیری نتایج ارائه و تفسیر شوند، ممکن است شامل خطا یا فریب‌کاری (عمدی) باشند. به عنوان یک مصرف‌کننده‌ی تفاسیر آماری، وقتی به نتایج یک پژوهش، به‌خصوص پیمایش‌های تلفنی و اینترنتی و پیامکی، می‌نگریم باید درباره‌ی سوگیری خود-انتخاب‌گری هشیار باشیم.

 

منابع:

Huff, D. (1993). How to lie with statistics. WW Norton & Company.

Mauro, J. (2013). Statistical deception at work. Routledge.

Campbell, S. K. (2004). Flaws and fallacies in statistical thinking. Courier Corporation.

 

* این مجموعه شامل مقالاتی کوتاه درباره مغالطه‌ها و فریب‌های آماری است که به تدریج در گمانه منتشر می‌شود.