در بیشتر نرم‌افزارهای آماری برای سهولت در تصمیم‌گیری نسبت به نتیجه آزمون فرض آماری، شاخصی به نام «مقدار احتمال» (p-Value) ارائه می‌شود. این مقدار به محقق کمک می‌کند که بدون مراجعه به جداول توزیع‌های آماری بتواند در مورد رد یا عدم رد فرض صفر تصمیم بگیرید. گاهی به p-Value «احتمال با معنایی» (Significant Level) یا p-مقدار نیز می‌گویند. برای مثال در نرم‌افزار R‌ مقدار احتمال با p-Value و در نرم‌افزار SPSS مقدار احتمال با Sig نشان داده می‌شود.

محتوای این مطلب جهت یادگیری بهتر و سریع‌تر آن، در انتهای متن به صورت ویدیویی نیز ارائه شده است.

برای مشاهده ویدیوها کلیک کنید.

مقدار احتمال (p-Value)

برای آنکه بتوان درک مناسبی از مقدار احتمال بدست آورد، ابتدا باید در مورد آزمون فرض آماری و مراحل انجام آن اطلاع داشت. پس اگر در این زمینه تازه‌کار هستید بهتر است ابتدا برای درک و آشنایی بیشتر، مطلب تحلیل‌ها و آزمون‌های آماری — مفاهیم و اصطلاحات را مطالعه کنید.

محاسبه مقدار احتمال برمبنای فرض صفر انجام می‌گیرد و از فرض مقابل استفاده‌ای نمی‌شود. بنابراین برمبنای مقدار احتمال می‌توان به رد فرض صفر ($$H_0$$) اقدام کرد. ولی باید توجه داشت که مقدار احتمال نمی‌تواند برای قبول فرض مقابل ($$H_1$$) معیار مناسبی باشد.

برای مثال یک آزمون فرض آماری را با فرضیات زیر برای پارامتر میانگین جامعه آماری، در نظر بگیرید:

$$\begin{cases} H_0: \mu =10\\ H_1: \mu= 20\\ \end{cases}$$

اگر فرض کنیم که براساس مقدار احتمال، فرض صفر رد شده است، مشخص نیست فرضیه‌ای که قبول خواهد شد حتما $$H_1$$ باشد. زیرا فرض مقابل می‌تواند هر یک از حالت‌های زیر باشد:

$$\begin{cases} H_0: \mu =10\\ H_1: \mu< 20\\ \end{cases}$$

$$\begin{cases} H_0: \mu =10\\ H_1: \mu> 20\\ \end{cases}$$

$$\begin{cases} H_0: \mu =10\\ H_1: \mu= 30\\ \end{cases}$$

بنابراین رد فرض صفر به معنی قبول فرض مقابل نخواهد بود.

ناحیه بحرانی و سطح آزمون دو طرفه

حال برای تعریف غیررسمی از مقدار احتمال، فرضیات زیر را در نظر می‌گیریم:

  •  X آماره آزمون است.
  • x حاصل آماره آزمون برحسب نمونه تصادفی است.
  • ناحیه بحرانی نیز به صورت X>x نوشته شده.

تعریف غیر رسمی مقدار احتمال: احتمال رد فرض صفر (براساس نمونه تصادفی و آماره آزمون و ناحیه بحرانی) به شرط آنکه فرض صفر صحیح باشد، مقدار احتمال نامیده می‌شود. بیان ریاضی برای این حالت به صورت زیر است:

p-Value=$$P(X >x|\;H_0)$$

برای درک بهتر به یک مثال می‌پردازیم.

مثال ۱

در یک بازی شانسی، باید یک سکه پرتاب شود. اگر سکه شیر بیاید برنده خواهیم بود و در غیر اینصورت بازنده. برگزار کننده این بازی ادعا دارد که سکه‌اش نااریب است. یعنی احتمال ظاهر شدن شیر با خط برابر است. برای اینکه ادعای برگزار کننده را بررسی کنیم یک آزمون آماری تشکیل می‌دهیم.

اگر p احتمال مشاهده شیر باشد، فرضیه‌های این آزمون آماری به صورت زیر است:

$$\begin{cases} H_0: p =\dfrac{1}{2}\\ H_1: p > \dfrac{1}{2}\\ \end{cases}$$

حال اگر X را تعداد شیر در ۱۰ بار پرتاب سکه در نظر بگیریم، با انجام این آزمایش، نتیجه آماره آزمون (یعنی همان X) براساس نمونه تصادفی (شمارش تعداد شیرها در ۱۰ بار پرتاب سکه) برابر با 6 شده است.

حال مقدار احتمال را محاسبه می‌کنیم.

$$P(X > 6|\;H_0)=1-P(X\leq 5|\;p=\tfrac{1}{2})=$$

$$1-(\sum_{i=1}^5 {10 \choose i}\tfrac{1}{2}^i\times \tfrac{1}{2}^{10-i})=1-0.6230=0.3770$$

این احتمال نشان می‌دهد که آزمون با صحیح بودن فرض صفر، چقدر وجود چنین نمونه‌ای را محتمل می‌داند. از آنجایی که این احتمال بزرگ به نظر می‌رسد، نمی‌توان فرض صفر را رد کرد.

همانطور که دیده شد وجود یا عدم وجود فرض مقابل تاثیری در محاسبه مقدار احتمال نداشت و با وجود فرض صفر، فقط ناحیه بحرانی و مقدار آماره آزمون برحسب نمونه تصادفی برای محاسبه مقدار احتمال کافی بود.

تعریف رسمی مقدار احتمال: کمترین مقداری از احتمال خطای نوع اول (سطح آزمون) که ممکن است یافته آماره آزمون، موجب رد فرض صفر شود.

مقدار احتمال و سطح آزمون

به بیان دیگر، در یک آزمون فرض، مقدار احتمال (p-Value) برابر با کمترین مقداری از سطح معنی‌داری (significance level) یا همان احتمال خطای نوع اول است، که موجب رد فرض صفر می‌شود.

با توجه به این موضوع، می‌توان قاعده‌ای برای انجام آزمون فرض آماری بوسیله مقدار احتمال در نظر گرفت: فرض صفر رد می‌شود، هر گاه مقدار احتمال از $$\alpha$$ (احتمال خطای نوع اول) کوچکتر باشد.

قاعده تصمیم با p-Value

شیوه محاسبه مقدار احتمال

در حالت کلی می‌توان مقدار احتمال را براساس نوع آزمون فرض برای پارمتر $$\theta$$ به صورت زیر محاسبه کرد.

در حالتی که آزمون فرض به صورت:

$$\begin{cases} H_0: \theta =\theta_0\\ H_1: \theta > \theta_0\\ \end{cases}$$

آزمون یک طرفه راست

مقدار احتمال به صورت زیر محاسبه می‌شود:

p-Value=$$P_{\theta_0}(X\geq x)$$

همچنین در حالتی که آزمون فرض به شکل:

$$\begin{cases} H_0: \theta =\theta_0\\ H_1: \theta < \theta_0\\ \end{cases}$$

آزمون یک طرفه چپ

مقدار احتمال به صورت زیر خواهد بود:

p-Value=$$P_{\theta_0}(X\leq x)$$

همینطور در حالتی که آزمون فرض به صورت:

$$\begin{cases} H_0: \theta =\theta_0\\ H_1: \theta \neq \theta_0\\ \end{cases}$$

آزمون دو طرفه

مقدار احتمال به صورت زیر قابل محاسبه است:

p-Value=$$2\min(P_{\theta_0}(X\leq x),P_{\theta_0}(X\geq x))$$

مثال ۲

متغیر تصادفی تعداد زدگی‌ها در یک توپ پارچه، دارای توزیع پواسن با پارامتر $$\lambda$$ است. طبق نظر کارشناس کارخانه متوسط تعداد زدگی در هر توپ پارچه برابر با ۵ است. به طور تصادفی یک توپ از پارچه‌ها انتخاب شده و تعداد زدگی‌ها برابر با ۱۰ شمارش شده است. در سطح خطای ۵٪، گفته کارشناس را بررسی می‌کنیم.

می‌دانیم تعداد زدگی‌ها (X) دارای توزیع پواسن با پرامتر $$\lambda$$‌ است. یعنی $$X\sim P(\lambda)$$.

حال با توجه به اینکه نظر کارشناس، گزاره‌ای است که از قبل در مورد پارامتر جامعه وجود داشته، فرض‌های مربوط به آزمون آماری را می‌نویسیم.

$$\begin{cases} H_0: \lambda =5\\ H_1: \lambda  \neq 5\\ \end{cases}$$

بنابراین مقدار احتمال به صورت زیر قابل محاسبه است:

$$P_{\lambda=5}(X\leq 10)=\sum_{k=1}^{10} \dfrac{e^{-5}5^k}{k!}=0.9863$$

و همچنین:

$$P_{\lambda=5}(X\geq 10)=1-P_{\lambda=5}(X\leq 9)=1-(\sum_{k=1}^{9} \dfrac{e^{-5}5^k}{k!})=1-0.9682=0.0318$$

در نتیجه خواهیم داشت:

p-Value=$$2\min(P(X\leq 10),P(X\geq 10))=2\min(0.9863,0.0318)=0.0636$$

از آنجایی که در سطح خطای 0.05 (۵٪) آزمون باید انجام شود، با مقایسه مقدار احتمال و سطح خطا متوجه می‌شویم که فرض صفر رد نمی‌شود. زیرا 0.0636 > 0.05 است.

مشکلات در تفسیر مقدار احتمال

اغلب در بیان توصیفی که مقدار احتمال ارائه می‌کند، مشکلاتی در بین دانشجویان دیده می‌شود.

  • مقدار احتمال، احتمال خطای نوع اول نیست. زیرا این مقدار براساس نمونه تصادفی محاسبه می‌شود ولی احتمال خطای نوع اول براساس متغیر تصادفی آماره آزمون بدست می‌آید.
  • از مقدار احتمال به عنوان یک معیار استفاده می‌شود و نمی‌توان از آن تفسیرهایی که در ادامه آمده است را ارائه داد؛ مثلا اگر مقدار احتمال نزدیک $$\alpha$$ بود نباید گفته شود که «تقریبا در بیشتر مواقع فرض صفر رد می‌شود» یا فاصله زیاد مقدار احتمال با $$\alpha$$ باعث شود که بگوییم «با اطمینان زیاد می‌توان فرض صفر را رد کرد» و … .

اگر مطلب بالا برای‌تان مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

فیلم‌ های آموزش مقدار احتمال (p-Value) در آزمون فرض آماری — به زبان ساده (+ دانلود فیلم آموزش رایگان)

فیلم آموزشی مفهوم مقدار احتمال

دانلود ویدیو

فیلم آموزشی شیوه محاسبه مقدار احتمال

دانلود ویدیو

فیلم آموزشی مشکلات در تفسیر مقدار احتمال

دانلود ویدیو

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

بر اساس رای 35 نفر

آیا این مطلب برای شما مفید بود؟

5 نظر در “مقدار احتمال (p-Value) در آزمون فرض آماری — به زبان ساده (+ دانلود فیلم آموزش رایگان)

  1. میشه راهنمایی کنید چیزی که من فهمیدم درست هست یا نه ؟
    اگر مقدار پی ما بیشتر از آلفا (که معمولا پنج درصد هست) باشه یعنی ما نمی تونیم فرض صفر رو رد کنیم. اگر کمتر باشه فرض صفر رو رد می کنیم . هر چی که پی ولیو به صفر نزدیک تر باشددلایل قوی تری برای رد فرض صفر داریم ؟ درسته ؟

    سپاسگزار

    1. سلام و درود
      از اینکه مطالب وبلاگ فرادرس را دنبال می‌کنید بسیار خرسنیدم.
      در پاسخ به سوال شما باید گفت که مقدار احتمال (پی ولیو) صفر نخواهد شد، بلکه مقدار آن ممکن است بسیار به صفر نزدیک باشد. در این حالت در بیشتر نرم‌افزارهای محاسبات آماری به علت گرد کردن نتایج اعداد اعشاری، این مقدار به نظر برابر با صفر می‌رسد. از طرفی هر چه پاسخ‌های پرسشنامه در جهت تایید فرض صفر باشند، مقدار احتمال بزرگ شده و نمونه حاصل دلیلی برای رد فرض صفر ارائه نخواهد داد.
      باز هم از اینکه همراه فرادرس هستید سپاسگزاریم و امیدواریم که همیشه همراه فرادرس باشید.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *