نوشتار

متخصصان آمار دربارۀ کاربرد نادرست «پی‌مقدار» هشدار می‌دهند

آمار دستورالعمل نیست، یک علم است

متخصصان آمار دربارۀ کاربرد نادرست «پی‌مقدار» هشدار می‌دهند

انجمن آمار امریکا در بیانیه‌ای که در فوریۀ ۲۰۱۶ منتشر کرد، درخصوص استفادۀ ناصحیح از پی‌مقدار هشدار داده و در اقدامی نامتعارف، اصولی را بعنوان راهنمایِ استفاده از پی‌مقدار تصویب کرده است. پی‌مقدار یا مقدار احتمال، معیار متداولی در سنجش قوت شواهد علمی است. این نخستین باری است که این انجمنِ ۱۷۷ساله، دربارۀ چنین موضوع بنیادینی در آمار توصیه‌های صریحی مطرح کرده است.

nature

Statisticians issue warning over misuse of P values

مونیا بیکر، نیچر — انجمن آمار امریکا در بیانیه‌ای که در فوریۀ ۲۰۱۶ منتشر کرد، هشدار داد که استفادۀ ناصحیح از پی‌مقدار۱ به‌عنوان معیار متداولی در سنجش قوت شواهد علمی، سبب افزایشِ یافته‌های پژوهشی‌ای شده که قابلیت بازتولید ندارند. انجمن مذکور در اقدامی نامتعارف، اصولی را بعنوان راهنمایِ استفاده از پی‌مقدار تصویب کرده است؛ طبق این اصول پی‌مقدار نمی‌تواند درستیِ یک فرضیه یا اهمیت نتایجِ به‌دست‌آمده را مشخص کند.

به‌گفتۀ ران واسرشتاین، مدیر اجرایی انجمن آمار امریکا، این نخستین باری است که این انجمنِ ۱۷۷ساله، توصیه‌های صریحی دربارۀ چنین موضوع بنیادینی در آمار مطرح کرده است. وی می‌افزاید که اعضای انجمن واقعاً نگران کاربرد ناصحیح پی‌مقدار بودند؛ چراکه این سوءکاربرد باعث ایجاد شک و شبهه دربارۀ کل آمار شده بود.

انجمن آمار امریکا در این بیانیه به پژوهشگران توصیه می‌کند صِرف پی‌مقدار را مبنای نتیجه‌گیری‌های علمی یا تصمیم‌گیری‌های خود در حوزۀ سیاست‌گذاری قرار ندهند. به‌گفتۀ انجمن، نه‌تنها پژوهشگران باید تحلیل داده‌هایی را شرح دهند که نتایج آماری معنی‌دار تولید کرده‌اند، بلکه باید تمام آزمون‌های آماری و انتخاب‌های صورت‌گرفته در محاسبات را نیز تشریح کنند. درغیر این صورت ممکن است نتایج حاصل‌شده به‌غلط محکم و قطعی تلقی شوند.

ورونیکا کی‌یرمر، سردبیر اجرایی کتابخانۀ عمومی مجلات علمی۲، خاطرنشان می‌کند که بیانیۀ انجمن آمار باعث می‌شود به آن نگرانی قدیمی درخصوص اعتماد نابجا به پی‌مقدار، مجددا توجه شود. وی می‌افزاید: «علاوه‌براین، بیانیۀ مذکور از این نظر که نشان می‌دهد آمارگیران به‌عنوان اعضای یک حرفه، با مسائل موجود در ادبیات خارج از حوزۀ حرفه‌ایِ خود درگیر هستند نیز اهمیت فراوانی دارد.»

سنجش شواهد
پی‌مقدار عموماً برای محک‌زدن و کنارگذاشتنِ «فرضیۀ صفر» به‌ کار می‌رود. فرضیۀ صفر به‌طور کلی بیانگر این است که دو گروه از پدیده‌ها تفاوتی با هم ندارند یا اینکه بین یک جفت از مشخصه‌ها همبستگی وجود ندارد. با فرض درستی فرضیۀ صفر، هر چه پی‌مقدار کوچک‌تر باشد، احتمال کمتری دارد که مجموعه‌ای از مقادیرِ مشاهده شده بطور اتفاقی بدست آمده باشند. پی‌مقدار ۰/۰۵ یا کمتر معمولاً چنین تعبیر می‌شود که یک یافته به‌لحاظ آماری معنی‌دار است و اجازۀ چاپ دارد؛ اما بر اساس بیانیۀ انجمن آمار اینگونه تعبیرکردنِ پی‌مقدار لزوماً درست نیست.

معنای پی‌مقدار ۰/۰۵ این نیست که شانس صحت فرضیه‌ای معین ۰/۹۵ است؛ درعوض، معنایش این است که اگر فرضیۀ صفرِ مدنظر درست باشد و تمام سایر فرض‌های درنظرگرفته‌شده نیز معتبر باشند، احتمالِ به‌دست‌آوردن نتیجه‌ای دستِ‌کم به حد نتیجۀ مشاهده‌شده، ۵درصد است. به‌علاوه، پی‌مقدار نشان‌دهندۀ میزان اهمیت یک یافته نیست؛ به‌طورمثال، ممکن است اثر یک دارو به‌لحاظ آماری بر میزان قند خون بیمار زیاد باشد، بدون اینکه داروی مدنظر اثر درمانی خاصی داشته باشد.

به‌گفتۀ جُوانی پارمیجانی، متخصص آمار زیستی از مؤسسۀ سرطان دانا فاربر در بوستون ماساچوست، بدفهمی دربارۀ اطلاعاتی که یک پی‌مقدار می‌تواند به ما بدهد، اغلب از کتاب‌های درسی و دفترچه‌های راهنمای عملی سر در می‌آورد. به‌عقیدۀ او دیرزمانی است که وقت اصلاح این مسیر فرارسیده است. «مطمئناً اگر چنین چیزی بیست سال قبل اتفاق افتاده بود، تحقیقات زیستی اینک در وضعیت بهتری می‌بود.»

افزایش نارضایتی‌ها
انتقاد از پی‌مقدار مسئلۀ جدیدی نیست. در سال ۲۰۱۱، پژوهشگران جهت افزایشِ آگاهی دربارۀ «مثبت‌های کاذب»۳، تجزیه‌تحلیلی ترتیب دادند تا به یافتۀ آماری معنی‌داری دست یابند. یافتۀ مذکور این بود که گوش‌دادن به موسیقی [گروه] بیتلز دانشجویان دورۀ کارشناسی را جوان‌تر می‌کند. در نمونه‌ای بحث‌برانگیزتر، در سال ۲۰۱۵، گروهی از مستندسازان نتایجی از یک آزمایش بالینیِ عمداً جعلی منتشر کردند که با پی‌مقدارِ محکمی تأیید می‌شد؛ تا نشان دهند که خوردن شکلات به کاهش وزن افراد کمک می‌کند. مقالۀ یادشده از آن زمان تاکنون تکذیب شده است.

اما سیمین وزیری، روان‌شناسی از دانشگاه دیویسِ کالیفرنیا و ویراستار مجلۀ سایکولوژیکال اند پرسونالیتی ساینس، معتقد است که بیانیۀ انجمن آمار امریکا می‌تواند نویسندگان را قانع کند که راز تمام تحلیل‌های آماری صورت‌گرفته را افشا کنند. به‌گفتۀ او «این بیانیه کمک می‌کند آمارگران، طوری‌ که ممکن است مردم به شک بیفتند، بگویند: نه؛ شما نمی‌توانید بدون داشتن این اطلاعات پی‌مقدار را تفسیر کنید».

به‌عقیدۀ اندرو ویکرز، متخصص آمار حیاتی در مرکز سرطان اسلون کترینگ در نیویورک، اقدامات شدیدتر مثل اقدام صورت‌گرفته توسط حداقل یک مجله در تحریم انتشار مقالاتی که دربردارندۀ پی‌مقدار هستند، می‌تواند اثر معکوس داشته باشد. وی تلاش برای تحریم استفاده از پی‌مقدار را مثل این می‌داند که در توضیح خطر حوادث جاده‌ای به مردم هشدار دهیم رانندگی نکنند. روشن است که بسیاری از مخاطبین هدف، احتمالاً آن هشدار را نادیده خواهند گرفت. ویکرز خاطرنشان می‌کند که درعوض، پژوهشگران باید یاد بگیرند که «‌با آمار مثل یک علم رفتار کنند؛ نه یک دستورالعمل».

اندرو گلمان، متخصص آمار دانشگاه کلمبیا در نیویورک، هشدار می‌دهد که درهرحال، حتی فهم بهتر پی‌مقدار نمی‌تواند ازبین برندۀ انگیزۀ انسان برای استفاده از آمار در جهت ایجاد سطحی دست‌نایافتنی از قطعیت باشد. به‌گفتۀ او «مردم دنبال چیزی هستند که واقعاً نمی‌توانند بدان دست یابند. آن‌ها در جست‌وجوی یقین هستند».


پی‌نوشت‌ها:
• این مطلب را مونیا بیکر نوشته است و در تاریخ ۷ مارس ۲۰۱۶ با عنوان «Statisticians issue warning over misuse of P values» در وب‌سایت نیچر منتشر شده است. وب‌سایت ترجمان در تاریخ ۱۴ ارديبهشت ۱۳۹۵ این مطلب را با عنوان «متخصصان آمار دربارۀ کاربرد نادرست "پی‌مقدار" هشدار می‌دهند» و ترجمۀ مهدیه توکل منتشر کرده است.
•• مونیا بیکر (Monya Baker) مدرک لیسانس زیست‌شناسی خود را از کالج کارلتون دریافت کرده و دارای فوق لیسانس آموزش و پرورش از دانشگاه هاروارد است. او برای اکونومیست، نیو ساینتیست، نیچر، نیچر بیوتکنولوژی، وایرد و نشریات دیگر می‌نویسد.
[۱]
یکی از مسائل بسیار مهم موجود در آمار استنباطی، آزمون فرض‌های آماری است که در تصمیم‌گیری بسیار حائز اهمیت است. در آزمون فرض، مسئلۀ ارائۀ یک معیار برای پذیرفتن یا ردکردن فرض، مطرح است. پی‌مقدار یا p value یا Probability Value یکی از معیارهایی است که جهت انجام آزمون فرض معرفی شده ‌است.
[۲] Public Library of Science journals
[۳] در آمار دو شاخص برای ارزیابی نتیجۀ یک آزمایشِ دوحالته وجود دارد. فرض کنید بتوان در یک آزمایش، داده‌ها را به دو گروه «مثبت» و «منفی» تقسیم کرد. در این صورت دقت نتایج این آزمایش را با استفاده از دو شاخص می‌توان سنجیده و توصیف کرد: حساسیت و ویژگی. true positive rate به‌معنی نسبتی از موارد مثبت است که آزمایش، آن‌ها را به‌درستی، «مثبت» علامت‌گذاری می‌کند. true negative rate به‌معنی نسبتی از موارد منفی است که آزمایش آن‌ها را به‌درستی، «منفی» علامت‌گذاری می‌کند.
مثبت صحیح (True Positive): شخص بیمار، به‌درستی بیمار تشخیص داده شود.
مثبت کاذب (False Positive): شخص سالم، به‌اشتباه بیمار تشخیص داده شود.
منفی صحیح (True Negative): شخص سالم، به‌درستی سالم تشخیص داده شود.
منفی کاذب (False Negative): شخص بیمار، به‌اشتباه سالم تشخیص داده شود.
حساسیت به‌بیان ریاضی، حاصل تقسیم موارد مثبت واقعی به حاصل‌جمع موارد مثبت واقعی و موارد منفی کاذب است.

مرتبط

راست‌های افراطی کيستند؟ چه می‌گويند؟ و چه اهميتی دارند؟

راست‌های افراطی کيستند؟ چه می‌گويند؟ و چه اهميتی دارند؟

راست‌افراطی: جست‌وجویی تباه در جهانی ویران‌شده

چطور اینستاگرام به معبد فرقه‌ها تبدیل شد؟

چطور اینستاگرام به معبد فرقه‌ها تبدیل شد؟

فرقه‌ها از تنهایی بیرونمان می‌آورند و تنهاترمان می‌کنند

آنتونی اتکینسون: میراثی برای ساختن دنیایی برابرتر

آنتونی اتکینسون: میراثی برای ساختن دنیایی برابرتر

تاریخ مطالعات فقر و نابرابری در قرن گذشته با تلاش‌های این اقتصاددان بریتانیایی درهم‌آمیخته است

چگونه مصرف کالاها می‌تواند از آدم‌ها دیو یا فرشته بسازد؟

چگونه مصرف کالاها می‌تواند از آدم‌ها دیو یا فرشته بسازد؟

کالاهایی که در فروشگاه چیده می‌شود ممکن است محصول کار کودکان یا بیگاری کارگران باشد

خبرنامه را از دست ندهید

نظرات

برای درج نظر ابتدا وارد شوید و یا ثبت نام کنید

گردآوری و تدوین لارنس ام. هینمن

ترجمه میثم غلامی و همکاران

امیلی تامس

ترجمه ایمان خدافرد

سافی باکال

ترجمه مینا مزرعه فراهانی

لیا اوپی

ترجمه علیرضا شفیعی نسب

دیوید گرِیبر

ترجمه علیرضا شفیعی نسب

جو موران

ترجمه علیرضا شفیعی نسب

لی برِیوِر

ترجمه مهدی کیانی

آلبرتو منگوئل

ترجمه عرفان قادری

گروهی از نویسندگان

ترجمه به سرپرستی حامد قدیری و هومن محمدقربانیان

d

خرید اشتراک چهار شمارۀ مجلۀ ترجمان

تخفیف+ارسال رایگان+چهار کتاب الکترونیک رایگان (کلیک کنید)

آیا می خواهید از جدیدترین مطالب ترجمان آگاه شوید؟

بله فعلا خیر 0