آشنایی با آمار شواهدی | مفاهیم و کاربردها


اصطلاح «استنباط شواهدی» و «شواهد آماری» دو واژهای هستند که امروز در نزد بعضی از دانشمندان آمار مطرح شده و در حال تبدیل شدن به یک مکتب آماری مانند «آمار بیز» (Bayesian Statistics) یا «آمار کلاسیک» (Classical Statistics) است. تعداد کتابهای مربوط به این حوزه نیز رو به افزایش بوده و مقالات متعددی نیز در نشریه و مجلات معتبر علمی در داخل و خارج در حال انتشار است. در این نوشتار قصد داریم هر چند به طور خلاصه با «شواهد آماری» (Statistical Evidence) آشنایی پیدا کنیم و مفاهیم و کاربردهای آن را در حوزه آمار کاربردی معرفی نماییم. با توجه به تکیه این شاخه از آمار به شواهد و مشاهدات، عنوان آمار شواهدی به آن نسبت داده شده است. موضوع اصلی در آمار یا استنباط شواهدی، بهرهگیری از تابع درستنمایی و بیشینهسازی آن است. به این ترتیب تمرکز بر تابع درستنمایی بوده و بیشتر تکنیکهای آماری کلاسیک، مبتنی بر آن بازنویسی و بازخوانی شدهاند.
برای درک بهتر این نوشتار بهتر است که مطالب دیگر فرادرس در مورد استنباط آماری و تابع درستنمایی را مطالعه کنید. در نتیجه خواندن استنباط و آزمون فرض آماری — مفاهیم و اصطلاحات و همچنین تابع درست نمایی (Likelihood Function) و کاربردهای آن — به زبان ساده توصیه میشود. البته خواندن متن متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و امید ریاضی (Mathematical Expectation) — مفاهیم و کاربردها نیز خالی از لطف نیست.
آشنایی با آمار شواهدی
از حوزههای جدید در «آمار استنباطی» (Statistical Inference) میتوان به بحث «آمار شواهدی» (Statistical Evidence) یا استنباط شواهدی توجه داشت. این حوزه از آمار استنباطی، توسط پروفسور «ریچارد رویال» (Richard Royal) استاد (بازنشسته) دانشگاه «جان هاپکینز» (Johns Hopkins University) آمریکا در حال توسعه و ترویج است. این نوشتار برداشتی از مقالهای است که توسط ایشان با عنوان «شواهدی آماری چه هست و چه نیست» (What Statistical Evidence Is and What It Is Not) تهیه شده است.
اخیرا در بعضی از متون روششناسی آمار اشاره به مکتب نوینی از استنباط آماری به چشم میخورد که در آن استنباط صرفا متکی به دادهها و الگوی احتمالی است و از مولفههای ذهنی، شخصی و موردی نظیر باورهای پیشین و توابع زیان تأثیر نمیپذیرد. جلودار و پیشتاز این حرکت جدید، پروفسور «ریچارد رویال» است که کتاب وی تحت عنوان «شواهد آماری»، اصول اولیه این شیوه جدید استنباط را در بردارد.
محور اصلی این روش، «تابع درستنمایی» (Likelihood Function) است، ولی علاوه بر اتکا به اصل درستنمایی (مانند بسیاری از روشهای کلاسیک) این شیوه استنباط به شدت بر اصل مشابه (ولی متفاوت) دیگری به نام «قانون درستنمایی» (Law of Likelihood) متکی است. آزمونها و بازههای اطمینان (اگر استفاده از این نامها در شیوه جدید مناسب باشد) به گونهای دیگر در این رویکرد، تعریف و اجرا میشوند.
گرچه تاکنون پژوهشهای زیادی درباره این مکتب جدید انجام نشده است، ولی به نظر میرسد که این شیوه تحلیل دادههای آماری در آینده نزدیک، جایی در کنار مکاتب «تحلیل بیزی» و «نظریه نیمن-پیرسون» (Neyman-Pearson Theorem) خواهد داشت.

آمار شواهدی چیست؟
همانطور که میدانید، استنباط یا آزمون فرض آماری روشی برای پاسخ به این پرسش است که آیا مشاهدات حاصل از یک نمونه تصادفی، شواهدی بر غلبه یک فرضیه بر فرضیه دیگر دارند یا خیر؟ این سوال در حقیقت شاکله و اصل موضوع استنباط آماری را تشکیل میدهد.
یکی از رویکردهای مربوط به پاسخ این سوال، برآمده از نظریه تصمیم و دیدگاه «نیمن-پیرسن» (Neyman-Pearson) است که انتخاب یا تعیین صحت هر یک از فرضیهها در استنباط آماری را به یک تصمیم نسبت میدهد. برعکس در نظریه آمار شواهدی، از مشاهدات حاصل از نمونهگیری به منظور کسب شواهد نسبت به هر یک از فرضیهها استفاده میشود.
خوشبختانه تابع یا قانون درستنمایی میتواند چاره ساز باشد. این اصل به صورت زیر مطرح میشود.
اگر فرضیه منجر به آن شود که احتمال مقدار متغیر تصادفی برای گرفتن مقدار به صورت در آید و در مقابل فرضیه نیز همین احتمال را به صورت مشخص کند، آنگاه مشاهده شاهدی بر پشتیبانی نسبت به است، اگر و فقط اگر باشد. به این ترتیب نسبت درستنمایی یعنی میزان قدرت این شاهد را نشان میدهد.
تعریفی که در بالا معرفی شد، امکان ایجاد یک رابطه ترتیبی و در نتیجه مقایسهای برای هر یک از این احتمالات ارائه میکند. این موضوع همچنین باعث کنار گذاشتن احتمال به عنوان نمایش قدرت پشتیبانی مشاهدات از یک فرضیه در مقابل فرض دیگر میشود.
به این ترتیب با به کارگیری دنبالهای از متغیرهای تصادفی، تابع نسبت درستنمایی میتواند به کار آید. ولی به کارگیری نسبت درستنمایی و محاسبات مربوط به آزمون فرض طبق دیدگاه نیمن-پیرسون ممکن است گاهی به شکست انجامد. برای روشن شدن موضوع به یک مثال میپردازیم.

مثال
یک آزمایش برنولی را در نظر بگیرد که ۳۰ بار تکرار شده است. همچنین فرض کنید که دو فرضیه در مورد احتمال موفقیت یا پارامتر مجهول (پارامتر جامعه ) وجود داد.
اگر تعداد موفقیتهای مشاهده شده را برابر با بگیریم، نسبت درستنمایی برای درمقابل به صورت زیر خواهد بود.
«ناحیه بحرانی» (Critical Area) در سطح در این حالت، مقادیری از است که برای آن تابع درستنمایی بیشتر یا مساوی با باشد. پس خواهیم داشت:
نکته: توجه داشته باشید که احتمال مشاهده ۱۲ موفقیت یا بیشتر در ۲۰ بار تکرار آزمایش برنولی تحت فرض (یعنی احتمال موفقیت ) برابر با 0.05 است.
اگر مقدار مشاهده برای تعداد موفقیتها ۱۲ باشد ()، آنگاه همانطور که ملاک آزمون مشخص کرده است، رای به صحت میدهیم، در حالیکه شواهد و مشاهدات به درستی بر آمدهاند.
رابطه بالا نشانگر شاهدی قوی برای پشتیبانی از فرض است، در حالیکه آزمون را درست تشخیص داده است. اگر باشد، روش نسبت درستنمایی، به یک اندازه موافقت خود را به هر دو فرض اعلام میکند و در نتیجه قادر به اتخاذ تصمیم در مورد صحت هیچکدام از آنها نیستیم.
ولی توجه داشته باشید که روش نیمن-پیرسون، رای به رد فرض میدهد.
به طور کلی اگر تابع درستنمایی براساس فرضیه باشد، شواهد، رای به فرضیه میدهند اگر و برعکس شواهد حاصل، پشتیبان فرض هستند اگر نسبت گفته شده کمتر از باشد.
از طرفی اگر باشد، شواهد ضعیفی نسبت به دو فرضیه در اختیارمان قرار گرفته است. البته توجه داشته باشید که در اینجا مورد نظر است. انتخاب مقدار مناسب نیز در اینجا بستگی به «احتمال شواهد گمراه کننده» (Misleading Evidence) و «احتمال شواهد ضعیف» (Week Evidence) دارد.

الگوی تفکری آمار شواهدی
در قسمت قبل خواندیم که در استنباط یا آمار شواهدی، هدف نمایش میزان پشتیبانی مشاهدات بدست آمده توسط نمونه از یک فرضیه یا تفکر آماری است. مبانی نظری الگوی تفکر شواهدی، برگرفته از «تابع درستنمایی» (Likelihood Function)، «اصل درستنمایی» (Likelihood Principle)، «قانون درستنمایی» (Law of Likelihood) و «نسبت درستنمایی» (Likelihood Ratio) است.
تابع درستنمایی و به کارگیری آن توسط آمارشناس بزرگ، «رونالد فیشر» (Ronald Fisher) در سال ۱۹۲۱ مطرح و به کار گرفته شد. بعدها در سال ۱۹۶۲، «آلان بیرنباوم» (Allan Brinbaum)، قانون درستنمایی را بر اساس «اصل شرطیسازی» (Conditionality Principle) مطرح کرد و گشایش بزرگی در توسعه تفکر شواهدی ایجاد نمود.
اصل شرطیسازی بیان میکند که اگر یک آزمایش توسط یک فرآیند تصادفی مستقل از وضعیت طبیعی پارامتر انتخاب شود، فقط آن آزمایش میتواند مبنایی برای انجام استنباط مربوط به پارامتر باشد.
خوشبختانه استنباط شواهدی مبتنی بر تابع درستنمایی است که در مورد کاربردی بودن آن همه آمارشناسان اتفاق نظر دارند. در نتیجه به کارگیری آن براساس سلیقه یا نظر شخصی (مانند تفکر بیزی) صورت نمیگیرد. از طرفی تابع زیان که در نظریه تصمیم بسیار با اهمیت است، نقشی در تفکر شواهدی ندارد.
همانطور که مشخص است، روش استنباط یا آمار شواهدی یک «الگوی تفکری» (Paradigm) در آمار است و نباید آن را جایگزینی برای روشهای تفکر قبلی در نظر گرفت. هر یک از الگویهای تفکری در آمار، نسبت به استنباط آماری، پرسشهای متفاوتی مطرح کرده و پاسخی مناسب برایشان پیدا کردهاند.
در یک بررسی یا استنباط آماری میتوان به سه گونه، پرسشهایی را مطرح کرد. البته فرض بر این است که مشاهداتی از نمونه آماری تهیه شده است که باید براساس آنها پاسخهایی برای این پرسشها تهیه نمود.
- به کمک مقادیر حاصل از نمونه نسبت به پذیرش مدل یا رد کدام فرضیه اقدام کنیم؟ (نظریه تصمیم و دیدگاه نیمن-پیرسون)
- در باره درستی مدل یا رد فرضیه، این مشاهدات چه نقشی خواهند داشت؟ (نظریه بیز و استفاده از باورهای قبلی)
- نتایج حاصل از مشاهدات به چه میزان پشتیبان فرضیههای آماری (مدل ایجاد شده) هستند؟ (استنباط شواهدی)
واضح است که هر یک از سوالات متفاوت بوده و پاسخ هر گرایش تفکر آماری نیز برایشان متفاوت است.
پس نباید هر یک از آنها را در تقابل با یکدیگر در نظر گرفت. ولی آن چه که مهم است، پرسشی است که باید به واسطه استنباط آماری به آن پاسخ دهیم. این که کدام از یک پرسشهای یاد شده، دلیل اصلی به کارگیری تحلیل آماری هستند، چشمانداز اصلی برای به کارگیری روشهای آماری را مشخص میکند.

خلاصه و جمعبندی
توجه به قانون درستنمایی و به تبع آن تابع درستنمایی، ابزاری برای بهرهگیری از اطلاعاتی است که نمونه تصادفی از پارامتر مجهول جامعه آماری دارد. این امر، مبنای کار در استنباط یا آمار شواهدی است. به این ترتیب محاسبه تابع درستنمایی و پیدا کردن بیشینه آن برای بدست آوردن برآوردگر مناسب برای پارامتر از ویژگیهای آمار شواهدی است. همچنین آزمونهای فرض آماری در استنباط شواهدی علاوه بر تکیه بر «فرض صفر» (Null Hypothesis) به «فرض مقابل» (Alternative Hypothesis) نیز توجه میکنند. در حالیکه در آزمون فرض به سبک نیمن-پیرسون، فقط فرض صفر و بیشینهسازی تابع درستنمایی روی کل فضای پارامتری مورد توجه است. در این نوشتار هدف آشنایی با آمار شواهدی و کاربردهای آن بود. همانطور که دیدید، مبانی اصلی به کار رفته در این حوزه، ساده بوده و بیشتر بر مبنای شواهد (یا نمونه آماری) متکی است.
سلام
تقریبا یک هفته است در خصوص مباحث آماری و تشخیص مدل مناسب آماری از نوشته های شما استفاده می کنم. بسیار کاربردی با زبان علمی و با نظم خیلی خوبی عنوان شده است.
بسیار ممنون از زحمات شما.