آشنایی با آمار شواهدی | مفاهیم و کاربردها

۲۷۷ بازدید
آخرین به‌روزرسانی: ۲۷ خرداد ۱۴۰۲
زمان مطالعه: ۶ دقیقه
آشنایی با آمار شواهدی | مفاهیم و کاربردها

اصطلاح «استنباط شواهدی» و «شواهد آماری» دو واژه‌ای هستند که امروز در نزد بعضی از دانشمندان آمار مطرح شده و در حال تبدیل شدن به یک مکتب آماری مانند «آمار بیز» (Bayesian Statistics) یا «آمار کلاسیک» (Classical Statistics) است. تعداد کتاب‌های مربوط به این حوزه نیز رو به افزایش بوده و مقالات متعددی نیز در نشریه و مجلات معتبر علمی در داخل و خارج در حال انتشار است. در این نوشتار قصد داریم هر چند به طور خلاصه با «شواهد آماری» (Statistical Evidence) آشنایی پیدا کنیم و مفاهیم و کاربردهای آن را در حوزه آمار کاربردی معرفی نماییم. با توجه به تکیه این شاخه از آمار به شواهد و مشاهدات، عنوان آمار شواهدی به آن نسبت داده شده است. موضوع اصلی در آمار یا استنباط شواهدی، بهره‌گیری از تابع درستنمایی و بیشینه‌سازی آن است. به این ترتیب تمرکز بر تابع درستنمایی بوده و بیشتر تکنیک‌های آماری کلاسیک، مبتنی بر آن بازنویسی و بازخوانی شده‌اند.

برای درک بهتر این نوشتار بهتر است که مطالب دیگر فرادرس در مورد استنباط آماری و تابع درستنمایی را مطالعه کنید. در نتیجه خواندن استنباط و آزمون فرض آماری — مفاهیم و اصطلاحات و همچنین تابع درست نمایی (Likelihood Function) و کاربردهای آن — به زبان ساده توصیه می‌شود. البته خواندن متن متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و امید ریاضی (Mathematical Expectation) — مفاهیم و کاربردها نیز خالی از لطف نیست.

آشنایی با آمار شواهدی

از حوزه‌های جدید در «آمار استنباطی» (Statistical Inference) می‌توان به بحث «آمار شواهدی» (Statistical Evidence) یا استنباط شواهدی توجه داشت. این حوزه از آمار استنباطی، توسط پروفسور «ریچارد رویال» (Richard Royal) استاد (بازنشسته) دانشگاه «جان هاپکینز» (Johns Hopkins University) آمریکا در حال توسعه و ترویج است. این نوشتار برداشتی از مقاله‌ای است که توسط ایشان با عنوان «شواهدی آماری چه هست و چه نیست» (What Statistical Evidence Is and What It Is Not) تهیه شده است.

اخیرا در بعضی از متون روش‌شناسی آمار اشاره به مکتب نوینی از استنباط آماری به چشم می‌خورد که در آن استنباط صرفا متکی به داده‌ها و الگوی احتمالی است و از مولفه‌های ذهنی، شخصی و موردی نظیر باورهای پیشین و توابع زیان تأثیر نمی‌پذیرد. جلودار و پیشتاز این حرکت جدید، پروفسور «ریچارد رویال» است که کتاب وی تحت عنوان «شواهد آماری»، اصول اولیه این شیوه جدید استنباط را در بردارد.

محور اصلی این روش، «تابع درستنمایی» (Likelihood Function) است، ولی علاوه بر اتکا به اصل درستنمایی (مانند بسیاری از روش‌های کلاسیک) این شیوه استنباط به شدت بر اصل مشابه (ولی متفاوت) دیگری به نام «قانون درستنمایی» (Law of Likelihood) متکی است. آزمون‌ها و بازه‌های اطمینان (اگر استفاده از این نام‌ها در شیوه جدید مناسب باشد) به گونه‌ای دیگر در این رویکرد، تعریف و اجرا می‌شوند.

گرچه تاکنون پژوهش‌های زیادی درباره این مکتب جدید انجام نشده است، ولی به نظر می‌رسد که این شیوه تحلیل داده‌های آماری در آینده نزدیک، جایی در کنار مکاتب «تحلیل بیزی» و «نظریه نیمن‌-پیرسون» (Neyman-Pearson Theorem) خواهد داشت.

کارل پیرسون
تصویر ۱: کارل پیرسون (Karl Pearson)، آمارشناس انگلیسی

آمار شواهدی چیست؟

همانطور که می‌دانید، استنباط یا آزمون فرض آماری روشی برای پاسخ به این پرسش است که آیا مشاهدات حاصل از یک نمونه تصادفی، شواهدی بر غلبه یک فرضیه بر فرضیه دیگر دارند یا خیر؟ این سوال در حقیقت شاکله و اصل موضوع استنباط آماری را تشکیل می‌دهد.

یکی از رویکردهای مربوط به پاسخ این سوال، برآمده از نظریه تصمیم و دیدگاه «نیمن-پیرسن» (Neyman-Pearson) است که انتخاب یا تعیین صحت هر یک از فرضیه‌ها در استنباط آماری را به یک تصمیم نسبت می‌دهد. برعکس در نظریه آمار شواهدی، از مشاهدات حاصل از نمونه‌گیری به منظور کسب شواهد نسبت به هر یک از فرضیه‌ها استفاده می‌شود.

خوشبختانه تابع یا قانون درستنمایی می‌تواند چاره ساز باشد. این اصل به صورت زیر مطرح می‌شود.

اگر فرضیه $$A$$ منجر به آن شود که احتمال مقدار متغیر تصادفی برای گرفتن مقدار $$x$$ به صورت $$P_A(x)$$ در آید و در مقابل فرضیه $$B$$ نیز همین احتمال را به صورت $$P_B(x)$$ مشخص کند، آنگاه مشاهده $$X=x$$ شاهدی بر پشتیبانی $$A$$ نسبت به $$B$$ است، اگر و فقط اگر $$P_A(x) > P_B(x)$$ باشد. به این ترتیب نسبت درستنمایی یعنی $$\frac{P_A(x)}{P(B(x)}$$ میزان قدرت این شاهد را نشان می‌دهد.

تعریفی که در بالا معرفی شد، امکان ایجاد یک رابطه ترتیبی و در نتیجه مقایسه‌ای برای هر یک از این احتمالات ارائه می‌کند. این موضوع همچنین باعث کنار گذاشتن احتمال به عنوان نمایش قدرت پشتیبانی مشاهدات از یک فرضیه در مقابل فرض دیگر می‌شود.

به این ترتیب با به کارگیری دنباله‌ای از متغیرهای تصادفی، تابع نسبت درستنمایی می‌تواند به کار آید. ولی به کارگیری نسبت درستنمایی و محاسبات مربوط به آزمون فرض طبق دیدگاه نیمن-پیرسون ممکن است گاهی به شکست انجامد. برای روشن شدن موضوع به یک مثال می‌پردازیم.

jerzy neyman
تصویر ۲: جرزی نیمن (Jerzy Neyman)، آمارشناس لهستانی

مثال

یک آزمایش برنولی را در نظر بگیرد که ۳۰ بار تکرار شده است. همچنین فرض کنید که دو فرضیه در مورد احتمال موفقیت یا پارامتر مجهول (پارامتر جامعه $$\theta$$) وجود داد.

$$ \large H_1: \theta = \frac{1}{4} $$

$$ \large H_2: \theta = \frac{3}{4} $$

اگر تعداد موفقیت‌های مشاهده شده را برابر با $$x$$ بگیریم، نسبت درستنمایی برای $$H_2$$ درمقابل $$H_1$$ به صورت زیر خواهد بود.

$$ \large \dfrac{f_2(x) }{f_1(x)} = 3^{(2 x - 30)} $$

«ناحیه بحرانی» (Critical Area) در سطح $$\alpha = 0.05$$ در این حالت، مقادیری از $$x$$ است که برای آن تابع درستنمایی بیشتر یا مساوی با $$k = 3^{24-30}=1/729$$ باشد. پس خواهیم داشت:

$$ \large 3^{2 x - 30} \geq 3^{24-30} \rightarrow x \geq 12 $$

نکته: توجه داشته باشید که احتمال مشاهده ۱۲ موفقیت یا بیشتر در ۲۰ بار تکرار آزمایش برنولی تحت فرض $$H_1$$ (یعنی احتمال موفقیت $$p= \frac{1}{4}$$) برابر با 0.05 است.

اگر مقدار مشاهده برای تعداد موفقیت‌ها ۱۲ باشد ($$x = 12 $$)، آنگاه همانطور که ملاک آزمون مشخص کرده‌ است، رای به صحت $$H_2$$ می‌دهیم، در حالیکه شواهد و مشاهدات به درستی $$H_1$$ بر آمده‌اند.

$$ \large \dfrac{f_1(12) }{f_2(12) } = 729 $$

رابطه بالا نشانگر شاهدی قوی برای پشتیبانی از فرض $$H_1$$ است، در حالیکه آزمون $$H_2$$ را درست تشخیص داده است. اگر $$x = 15$$ باشد، روش نسبت درستنمایی، به یک اندازه موافقت خود را به هر دو فرض اعلام می‌کند و در نتیجه قادر به اتخاذ تصمیم در مورد صحت هیچکدام از آن‌ها نیستیم.

$$ \large f_1(15) = f_2(15) = 1.2445 \times 10^{-11},  \;\; \rightarrow \dfrac{f_1(15)}{f_2(15)} = 1 $$

ولی توجه داشته باشید که روش نیمن-پیرسون، رای به رد فرض $$H_1$$ می‌دهد.

به طور کلی اگر $$L_i$$ تابع درستنمایی براساس فرضیه $$i$$ باشد، شواهد، رای به فرضیه $$H_2$$ می‌دهند اگر $$\frac{L_2}{L_1} \geq k$$ و برعکس شواهد حاصل، پشتیبان فرض $$H_1$$ هستند اگر نسبت گفته شده کمتر از $$\frac{1}{k}$$ باشد.

از طرفی اگر $$ \frac{1}{k} < \frac{L_2}{L_1} < k $$ باشد، شواهد ضعیفی نسبت به دو فرضیه در اختیارمان قرار گرفته است. البته توجه داشته باشید که در اینجا $$k >1$$ مورد نظر است. انتخاب مقدار $$k$$ مناسب نیز در اینجا بستگی به «احتمال شواهد گمراه کننده» (Misleading Evidence) و «احتمال شواهد ضعیف» (Week Evidence) دارد.

ronald fisher
تصویر ۳: رونالد فیشر (Ronald Fisher)، آمارشناس انگلیسی

الگوی تفکری آمار شواهدی

در قسمت قبل خواندیم که در استنباط یا آمار شواهدی، هدف نمایش میزان پشتیبانی مشاهدات بدست آمده توسط نمونه از یک فرضیه یا تفکر آماری است. مبانی نظری الگوی تفکر شواهدی، برگرفته از «تابع درستنمایی» (Likelihood Function)، «اصل درستنمایی» (Likelihood Principle)، «قانون درستنمایی» (Law of Likelihood) و «نسبت درستنمایی» (Likelihood Ratio) است.

تابع درستنمایی و به کارگیری آن توسط آمارشناس بزرگ، «رونالد فیشر» (Ronald Fisher) در سال ۱۹۲۱ مطرح و به کار گرفته شد. بعدها در سال ۱۹۶۲، «آلان بیرنباوم» (Allan Brinbaum)، قانون درستنمایی را بر اساس «اصل شرطی‌سازی» (Conditionality Principle) مطرح کرد و گشایش بزرگی در توسعه تفکر شواهدی ایجاد نمود.

اصل شرطی‌سازی بیان می‌کند که اگر یک آزمایش توسط یک فرآیند تصادفی مستقل از وضعیت طبیعی پارامتر $$ {\displaystyle \theta} $$ انتخاب شود، فقط آن آزمایش می‌تواند مبنایی برای انجام استنباط مربوط به پارامتر $$ {\displaystyle \theta} $$ باشد.

خوشبختانه استنباط شواهدی مبتنی بر تابع درستنمایی است که در مورد کاربردی بودن آن همه آمارشناسان اتفاق نظر دارند. در نتیجه به کارگیری آن براساس سلیقه یا نظر شخصی (مانند تفکر بیزی) صورت نمی‌گیرد. از طرفی تابع زیان که در نظریه تصمیم بسیار با اهمیت است، نقشی در تفکر شواهدی ندارد.

همانطور که مشخص است، روش استنباط یا آمار شواهدی یک «الگوی تفکری» (Paradigm) در آمار است و نباید آن را جایگزینی برای روش‌های تفکر قبلی در نظر گرفت. هر یک از الگوی‌های تفکری در آمار، نسبت به استنباط آماری، پرسش‌های متفاوتی مطرح کرده و پاسخی مناسب برایشان پیدا کرده‌اند.

در یک بررسی یا استنباط آماری می‌توان به سه گونه، پرسش‌هایی را مطرح کرد. البته فرض بر این است که مشاهداتی از نمونه آماری تهیه شده است که باید براساس آن‌ها پاسخ‌هایی برای این پرسش‌ها تهیه نمود.

  1. به کمک مقادیر حاصل از نمونه نسبت به پذیرش مدل یا رد کدام فرضیه اقدام کنیم؟ (نظریه تصمیم و دیدگاه نیمن-پیرسون)
  2. در باره درستی مدل یا رد فرضیه، این مشاهدات چه نقشی خواهند داشت؟ (نظریه بیز و استفاده از باورهای قبلی)
  3. نتایج حاصل از مشاهدات به چه میزان پشتیبان فرضیه‌های آماری (مدل ایجاد شده) هستند؟ (استنباط شواهدی)

واضح است که هر یک از سوالات متفاوت بوده و پاسخ هر گرایش تفکر آماری نیز برایشان متفاوت است.

پس نباید هر یک از آن‌ها را در تقابل با یکدیگر در نظر گرفت. ولی آن چه که مهم است، پرسشی است که باید به واسطه استنباط آماری به آن پاسخ دهیم. این که کدام از یک پرسش‌های یاد شده، دلیل اصلی به کارگیری تحلیل آماری هستند، چشم‌انداز اصلی برای به کارگیری روش‌های آماری را مشخص می‌کند.

Allan Brinbaum
تصویر ۴: آلان برونبام (Allan Brinbaum)، آمارشناس آمریکایی

خلاصه و جمع‌بندی

توجه به قانون درستنمایی و به تبع آن تابع درستنمایی، ابزاری برای بهره‌گیری از اطلاعاتی است که نمونه تصادفی از پارامتر مجهول جامعه آماری دارد. این امر، مبنای کار در استنباط یا آمار شواهدی است. به این ترتیب محاسبه تابع درستنمایی و پیدا کردن بیشینه آن برای بدست آوردن برآوردگر مناسب برای پارامتر از ویژگی‌های آمار شواهدی است. همچنین آزمون‌های فرض آماری در استنباط شواهدی علاوه بر تکیه بر «فرض صفر» (Null Hypothesis) به «فرض مقابل» (Alternative Hypothesis) نیز توجه می‌کنند. در حالیکه در آزمون فرض به سبک نیمن-پیرسون، فقط فرض صفر و بیشینه‌سازی تابع درستنمایی روی کل فضای پارامتری مورد توجه است. در این نوشتار هدف آشنایی با آمار شواهدی و کاربردهای آن بود. همانطور که دیدید، مبانی اصلی به کار رفته در این حوزه، ساده بوده و بیشتر بر مبنای شواهد (یا نمونه آماری) متکی است.

بر اساس رای ۲ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
مجله فرادرس
۱ دیدگاه برای «آشنایی با آمار شواهدی | مفاهیم و کاربردها»

سلام
تقریبا یک هفته است در خصوص مباحث آماری و تشخیص مدل مناسب آماری از نوشته های شما استفاده می کنم. بسیار کاربردی با زبان علمی و با نظم خیلی خوبی عنوان شده است.
بسیار ممنون از زحمات شما.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *