آزمون فرض میانگین جامعه در آمار — به زبان ساده

۱۱۸۰۸ بازدید
آخرین به‌روزرسانی: ۳۰ آبان ۱۴۰۲
زمان مطالعه: ۵ دقیقه
آزمون فرض میانگین جامعه در آمار — به زبان ساده

در آمار استنباطی یکی از مهمترین و معمول‌ترین روش‌ها، استفاده از آزمون آماری است. با استفاده از این روش، قادر هستیم در مورد پارامتر جامعه آماری براساس یک آزمون، قضاوت کنیم. این کار به کمک تحلیل روی نمونه تصادفی صورت گرفته و به محقق در تصمیم‌گیری در مورد پارامتر جامعه آماری یاری می‌رساند. برای اطلاعات بیشتر در مورد جامعه آماری به مطلب جامعه آماری — انواع داده و مقیاس‌های آن‌ها و برای آشنایی با مفاهیم اولیه در مورد آزمون آماری به مطلب تحلیل‌ها و آزمون‌های آماری — مفاهیم و اصطلاحات مراجعه کنید.

آزمون فرض میانگین جامعه نرمال

هدف اصلی در آزمون فرض برای میانگین جامعه ($$\mu$$)، تصمیم در مورد مقدار یا حدود میانگین جامعه است. بنابراین می‌توان از آزمون‌های ساده یا مرکب، یک طرفه یا دو طرفه برای این کار استفاده کرد.

فرض کنید آزمون مورد نظر از دو فرض صفر و فرض مقابل که به صورت زیر نوشته شده‌اند تشکیل شده است.

$$\begin{cases} H_0: \mu =\mu_0 \\ H_1: \mu= \mu_1\\ \end{cases}$$

باید توجه داشت که هر دو مقدار $$\mu_0$$ و $$\mu_1$$ دو مقدار حدسی برای میانگین جامعه بوده و معلوم هستند و از طرفی داریم $$\mu_0<\mu_1$$. از آنجایی که هم فرض صفر و هم فرض مقابل توزیع جامعه را مشخص می‌کنند، به آن‌ها فرضیه‌های ساده گفته شده و این آزمون فرض به صورت فرض ساده در مقابل ساده خوانده می‌شود.

نمودار توزیع نرمال (تصویر تزئینی مطلب آزمون فرض میانگین)

برای انجام این آزمون احتیاج به یک آماره آزمون داریم. همانطور که می‌دانید، آماره آزمون باید به پارامتر مجهول جامعه ($$\mu$$) وابسته نباشد. به این منظور دو حالت را در نظر می‌گیریم:

  1. زمانی که واریانس جامعه معلوم و مشخص باشد
  2. زمانی که واریانس مشخص نیست و باید از برآورد آن در آماره آزمون استفاده کرد.

آزمون فرض میانگین جامعه نرمال با معلوم بودن واریانس جامعه

در این حالت با معلوم بودن واریانس جامعه آماری، آماره آزمون Z را به صورت زیر تحت فرض $$H_0$$ در نظر می‌گیریم:

$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$

همانطور که دیده می‌شود، متغیر تصادفی Z تحت فرض $$H_0$$ به پارامتر مجهول وابسته نیست و توزیع آن نیز نرمال با میانگین صفر و واریانس 1 است. در نتیجه Z را آماره آزمون نامیده و ناحیه بحرانی را براساس آن ایجاد می‌کنیم. با توجه به فرض و شرطی که بین مقدار $$\mu_0$$ و $$\mu_1$$ وجود دارد ناحیه بحرانی را به صورت زیر تعریف می‌کنیم:

$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}>c$$

این ناحیه بحرانی نشان می‌دهد که اگر اختلاف میانگین نمونه از مقدار $$\mu_0$$ زیاد باشد (به ازاء هر واحد از انحراف استاندارد) به رد فرض صفر رای می‌دهیم. مقدار c را نیز با توجه به تعریف احتمال خطای نوع اول ($$\alpha$$) به صورت زیر بدست می‌آوریم.

$$\alpha=P(Reject\; H_0\;| H_0\; is \ true)=P(Z>c)=1-\Phi(c)$$

در این رابطه $$\Phi(c)$$ مقدار تابع توزیع احتمال نرمال استاندارد در نقطه c است. در نتیجه مقدار c را با استفاده از رابطه‌ زیر بدست می‌آوریم:

$$\Phi(c)=1-\alpha\rightarrow\; c=z_{1-\alpha}$$

به این ترتیب می‌توان ناحیه بحرانی را به صورت $$Z>z_{(1-\alpha)}$$ نوشت. پس فرض $$H_0$$ را رد می‌کنیم اگر مقدار آماره آزمون Z بزرگتر از صدک ($$1-\alpha$$) توزیع نرمال استاندارد باشد.

البته باید توجه داشت که با تغییر فرض مقابل ممکن است ناحیه بحرانی به شکل دیگری نوشته شود. در زیر به چند حالت از فرض مقابل و ناحیه بحرانی مربوطه اشاره می‌کنیم:

ناحیه بحرانیآماره آزمونفرض مقابلفرض صفر
$$Z>z_{(1-\alpha)}$$$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$$$\mu=\mu_1 ,\;\;\;\;\mu_1>\mu_0$$$$\mu=\mu_0$$
$$Z<-z_{(1-\alpha)}$$$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$$$\mu<\mu_0 $$$$\mu=\mu_0$$
$$|Z|>z_{(1-\frac{\alpha}{2})}$$$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$$$\mu\neq\mu_0$$$$\mu=\mu_0$$

در سطرهای اول و دوم، نوع آزمون یک طرفه و در سطر سوم آزمون دو طرفه در نظر گرفته شده است. همچنین در این جدول فرض صفر به صورت فرض ساده نوشته شده است.

نکته: اگر بتوان توزیع جامعه را نرمال فرض کرد و واریانس جامعه نیز معلوم باشد از آزمون Z‌ استفاده می‌شود. در عمل زمانی که تعداد مشاهدات بیشتر از ۳۰ باشند می‌توان توزیع Z را نرمال فرض کرد. در غیر اینصورت بهتر است از آزمون‌های مربوط به آماره T‌ استفاده شود.

فرمول آزمون فرض میانگین

مثال ۱

جامعه آماری، از پسرانی که در محدوده سنی 10 تا 12 سال هستند تشکیل شده‌ است. اطلاعات قبلی نشان می‌دهد که متوسط قد این افراد برابر است با 75 سانتی‌متر و واریانس جامعه آماری برای قد این پسران برابر است با $$11.6^2$$ سانتی‌متر مربع. با توجه به تغییر شیوه تغذیه اعتقاد داریم که میانگین قد پسرها در جامعه افزایش داشته و به 80 سانتی‌متر رسیده است. براساس یک نمونه ۲۵ تایی میانگین قدها برابر با 80.94 سانتی‌متر بدست آمده است. آیا می‌توان از اطلاعات قبلی در مورد قد اطمینان داشت یا می‌توان به کمک آزمون آماری نشان داد که تغییر محسوسی در میزان قد پسران رخ داده‌ است؟

برای پاسخ به این سوال دست به یک آزمون آماری می‌زنیم. فرضیات این آزمون به صورت زیر نوشته می‌شود:

$$\begin{cases} H_0: \mu =75\\ H_1: \mu= 80\\ \end{cases}$$

مشخص است که در اینجا $$\mu_0 = 75$$ و $$\mu_1 = 80$$ بوده و $$\mu_1 > \mu_0$$ است. همانطور که گفته شد، فرضیه صفر، نتایج و نظراتی که از قبل وجود داشته را بیان کرده ولی فرض مقابل نظر محقق را نشان می‌دهد. سعی داریم به کمک نمونه تصادفی تهیه شده، در مورد فرض صفر قضاوت کنیم. با توجه به آماره آزمون معرفی شده و ناحیه بحرانی آزمون فرض را انجام می‌دهیم.

$$Z=\dfrac{\overline{X}-\mu_0}{\frac{\sigma}{\sqrt{n}}}=$$

$$Z=\dfrac{80.94-75}{\frac{11.6}{\sqrt{25}}}=$$

$$Z=\dfrac{5.94}{2.32}=2.56$$

اگر میزان احتمال خطای نوع اول را $$\alpha=0.05$$ در نظر بگیریم، خواهیم داشت:

$$Z>z_{(1-\alpha)}=2.56>1.64$$

در نتیجه با خطای 0.05، رای به رد فرض $$H_0$$ می‌دهیم.

آزمون فرض میانگین جامعه نرمال با نامعلوم بودن واریانس جامعه

در این حالت با توجه به اینکه واریانس جامعه نامعلوم است، باید از برآورد آن در آماره آزمون استفاده کرد. به همین دلیل آماره آزمون دیگر دارای توزیع نرمال نخواهد بود. اگر برآورد واریانس جامعه را با $$S^2$$ نشان دهیم،‌ خواهیم داشت:

$$S^2=\dfrac{\sum_{i=1}^n (X_i-\overline{X})}{n-1}$$

$$S^2$$، برآوردگر نااریب برای واریانس جامعه است. براساس این برآوردگر آماره آزمونT را به صورت زیر در نظر می‌گیریم:

$$T=\dfrac{\overline{X}-\mu_0}{\frac{S}{\sqrt{n}}}$$

حال فرض کنید آزمون مورد نظر از دو فرض صفر و فرض مقابل که به صورت زیر نوشته شده‌اند تشکیل شده است.

$$\begin{cases} H_0: \mu =\mu_0 \\ H_1: \mu= \mu_1\\ \end{cases}$$

همانطور که دیده می‌شود، آماره آزمون مورد نظر (T) یک متغیر تصادفی است که تحت فرض $$H_0$$ به پارامتر مجهول وابسته نیست و دارای توزیع t-student با n-1 درجه آزادی است. این آماره توسط «ویلیام گوست» (William Gosset) شیمی‌دان و آماردان انگلیسی در سال 1908 معرفی و در آزمون‌های آماری بسیاری به کار گرفته شد.

ویلیام گوست
ویلیام گوست آماردان انگلیسی

با توجه به فرضیات مربوط به آزمون فرض که به صورت ساده در مقابل ساده نوشته شده است می‌توان ناحیه بحرانی را به صورتی در نظر گرفت که با بزرگ شدن آماره آزمون فرض صفر رد شود. در نتیجه ناحیه بحرانی با توجه به احتمال خطای نوع اول ($$\alpha$$) در این حالت به صورت زیر در خواهد آمد.

$$\alpha=P(Reject\; H_0\;| H_0\; is \ true)=P(T>c)=1-P(T\leq c)$$

$$1-\alpha=P(T\leq c)$$

بنابراین ناحیه بحرانی برابر است با $$T>t_{1-\alpha}(n-1)$$. پس اگر مقدار T براساس نمونه از مقدار صدک $$1-\alpha$$ توزیع t با n-1 درجه آزادی یا ($$t_{(1-\alpha)}(n-1)$$) بزرگتر باشد،‌ به رد فرض صفر رای می‌دهیم.

البته باید توجه داشت که با تغییر فرض مقابل ممکن است ناحیه بحرانی به شکل دیگری نوشته شود. در زیر به چند حالت از فرض مقابل و ناحیه بحرانی مربوطه اشاره می‌کنیم:

ناحیه بحرانیآماره آزمونفرض مقابلفرض صفر
$$T>t_{(1-\alpha)}(n-1)$$$$T=\dfrac{\overline{X}-\mu_0}{\frac{s}{\sqrt{n}}}$$$$\mu=\mu_1 ,\;\;\;\;\mu_1>\mu_0$$$$\mu=\mu_0$$
$$T<-t_{(1-\alpha)}(n-1)$$$$T=\dfrac{\overline{X}-\mu_0}{\frac{s}{\sqrt{n}}}$$$$\mu<\mu_0 $$$$\mu=\mu_0$$
$$|T|>t_{(1-\frac{\alpha}{2})}(n-1)$$$$T=\dfrac{\overline{X}-\mu_0}{\frac{s}{\sqrt{n}}}$$$$\mu\neq\mu_0$$$$\mu=\mu_0$$

در سطرهای اول و دوم نوع آزمون یک طرفه و در سطر سوم آزمون دو طرفه در نظر گرفته شده است. همچنین در این جدول فرض صفر به صورت فرض ساده نوشته شده است.

مثال ۲

یک شرکت تولید کننده موتورسیکلت ادعا دارد که میزان مصرف سوخت تولیداتش در هر ۱۰۰ کیلومتر برابر با 2 لیتر است. به این منظور سازمان بهینه‌سازی مصرف سوخت، ۸ موتورسیکلت از این شرکت را به منظور بررسی ادعایش تحویل گرفته. اطلاعات مربوط به مصرف سوخت این ۸ دستگاه در جدول زیر آورده شده است. در سطح خطای $$\alpha=0.05$$ ادعای تولید کننده بررسی می‌شود.

شماره نمونه12345678
مصرف سوخت3.02.83.22.63.32.52.83.0

با توجه به اطلاعات جدول، میانگین و انحراف معیار نمونه محاسبه شده و آماره آزمون بدست می‌آید.

$$\overline{X}=2.9,\;\;\;s(X)=0.278,\;\;\;n=8$$

حال آماره آزمون را محاسبه کرده و در ناحیه بحرانی قرار می‌دهیم.

$$T=\dfrac{\overline{X}-\mu_0}{\frac{s}{\sqrt{n}}}=$$

$$\dfrac{2.9-2}{\frac{0.278}{\sqrt{8}}}=9.165$$

با توجه به صدک 95ام از توزیع T با $$8-1=7$$ درجه آزادی که برابر با 1.895 است، می‌بینیم که آماره آزمون در ناحیه بحرانی قرار گرفته و فرض صفر رد می‌شود زیرا $$9.165 > 1.895$$ پس ادعای کارخانه تولید کننده موتورسیکلت رد می‌شود.

بر اساس رای ۶۵ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
۱۰ دیدگاه برای «آزمون فرض میانگین جامعه در آمار — به زبان ساده»

با عرض سلام.عدد 1.895 چطوری بدست آمده؟

تو مثال دوم انحراف معیار را من نمیدونم چطوری بدست اوردید فک میکنم جواب اشتباه باشه

سلام هر چند دیرشده اما می خواهم جواب آقای کاویان را بدهم
1-اعدادرا از جدول تی با درجه الفا خطا و درجه ازادی بدست امده
2-اگر توضیحات اینقدر مفصل می خواهید به کلاس باید مراجعه کنید تا در باره سوال و اشکال بیشتر توضیح داده شود
3- کمی انصاف به نظرم محیط را لطیفتر و افرادی که خدمت می کنند را دلگرمتر می کند
4- می توانستید از بیان بهتری استفاده کنید مثلا متشکرم برای من قابل استفاده نبود سوادم از کلاس بالاتر است
5- لطفا به حرف های من خوب فکر کنیداگر درست بود جامعه منتظر تغییر نگرش شما هست موفق باشید

بسیار عالی هست ممنون بابت تهیه این مطالب.

سلام اگر در مسئله حجم نمونه تعیین نشده بود ،حجم نمونه رو چطور باید به دست بیاریم؟

سلام دوست و همراه مجله فرادرس،

از این که مشکلاتتان را با ما درمیان می‌گذارید، سپاسگزاریم. در مورد سوال تعیین ححم نمونه بهتر است به مطلب تعیین حجم نمونه در تحلیل‌ های آماری — به زبان ساده مراجعه کنید. در این متن شیوه ‌های مختلف تعیین اندازه نمونه برای تحلیل های مختلف توضیح داده شده.

پیروز و سربلند باشید.

با سلام
شاید به جرات بتونم بگم بدترین آموزشی بود که در طول عمرم دیده و شنیده بودم. از فرا درس بعیده و باعث تاسفه که اعتبار خودش رو با چنین آموزش های مزخرفی بشدت پایین میاره.
در آموزش فوق 4 تا عدد داریم که معلوم نشد اینا از کجا اومدن یعنی ایشون به خودشون یه زحمت کوچیک ندادن فرمول بدست آوردن این اعداد رو یکجا بنویسن:
در مثال اول عدد 1/64 و در مثال دوم اعداد 1/895 و s=0/278 و شاهکار جالب آخرین جمله نوشته شده این بود که خیلی خنده دار بود: 9/165 کوچکتر از 1/895 که واقعا جالب بود در نوع خودش

با سلام و عرض ارادت،

در ابتدای متن به مطالب دیگری از مجله فرادرس اشاره شده که با خواندن آن‌ها بسیاری از مشکلات اشاره شده برطرف می‌شود. برای مثال مقدار صدک‌ها توزیع‌های نرمال و توزیع تی که اشاره فرمودید در این متن‌ها مورد اشاره قرار گرفته. از طرفی موضوع خیلی خنده دار هم با تغییر علامت کوچکتر به بزرگتر برطرف شد.

از اینکه همراه مجله فرادرس هستید و به اعتبار آن اهمیت می‌دهید، قدردان و سپاسگزاریم.

تندرست و پیروز باشید.

سلام.

متاسفانه تو همین فرادرس هم تناقض هست میان آموزش ها!!!
یعنی چی؟؟؟؟ یعنی توی این آموزش:
https://blog.faradars.org/t-test/
میگه میو1 برابر نیست با میو صفر (یعنی میتونه میو یک کمتر از میو صفر باشه)
اما اینجا میاد میگه فقط بزرگتره (بدون اینکه اشاره ای کنه که اصن چی هستند این میو ها.
مدرس عزیز واقعا خسته نباشی!!!

سلام بر شما همراه مجله فرادرس،

از اینکه نظراتتان را با ما در میان می گذارید، بسیار سپاسگزاریم.
حق با شما است در این متن اشاره‌ای به مفهوم میو نشده است. البته اگر با مبانی آمار و احتمال آشنایی داشته باشید می‌دانید که منظور از میو، میانگین جامعه آماری است. در ابتدای متن دو حدس برای میانگین زده شده که یکی میو صفر و دیگری میو یک است. حال فرض کرده ایم که این دو مقدار به شکلی هستند که میو یک کمتر از میون صفر باشد. سپس موارد بعدی را بیان کرده ایم.

متن با توجه به همین موضوع حتماً مورد بازیبینی قرار خواهد گرفت.

از مطرح کردن انتقادتان سپاسگزاریم.

تندرست و شاد و پیروز باشید.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *