انحراف استاندارد و خطای استاندارد — از صفر تا صد

۲۹۱۳۷ بازدید
آخرین به‌روزرسانی: ۲ اسفند ۱۴۰۲
زمان مطالعه: ۸ دقیقه
دانلود PDF مقاله
انحراف استاندارد و خطای استاندارد — از صفر تا صدانحراف استاندارد و خطای استاندارد — از صفر تا صد

اغلب در محاسبات و آزمون‌های آماری با دو واژه شبیه به هم به نام‌های انحراف استاندارد و خطای استاندارد مواجه می‌شویم. از آنجایی که این دو عبارت هر دو کلمه استاندارد را یدک می‌کشند، به نظر می‌رسند که یک ملاک عمومی برای سنجش ویژگی‌هایی آماری باشند. ولی آیا انحراف استاندارد و خطای استاندارد با یکدیگر تفاوت دارند یا واژه‌ای برای بیان یک خاصیت از جامعه آماری هستند؟ در این نوشتار می‌خواهیم به تفاوت و البته ارتباطی که بین این دو اصطلاح آماری وجود دارند، بپردازیم.

997696

به این منظور بهتر است ابتدا نوشتارهای دیگر مجله فرادرس مانند واریانس و اندازه‌های پراکندگی — به زبان ساده و امید ریاضی (Mathematical Expectation) — مفاهیم و کاربردها را مطالعه کنید. همچنین خواندن مطالب متغیر تصادفی، تابع احتمال و تابع توزیع احتمال، آزمایش تصادفی، پیشامد و تابع احتمال و میانگین وزنی — به زبان ساده نیز خالی از لطف نیست.

انحراف استاندارد و خطای استاندارد

در مباحث آماری، داده‌های جمع‌آوری شده، اغلب با استفاده از مقدار «میانگین» (Mean) و «انحراف استاندارد نمونه‌ای» (Sample Standard Deviation) توصیف می‌شوند. همچنین ممکن است این کار بوسیله مشخص کردن مقدار میانگین و «خطای استاندارد» (Standard Error) صورت گیرد.

با توجه به نزدیک بودن معنی دو اصطلاح انحراف استاندارد و خطای استاندارد اغلب ممکن است با یکدیگر اشتباه گرفته شده یا به شکل یکسانی تفسیر شوند. به یاد داشته باشید که میانگین و انحراف استاندارد، شاخص‌های توصیفی برای جامعه یا نمونه آماری هستند، در حالی که خطای استاندارد یا به طور دقیق‌تر، «خطای استاندارد میانگین» (Standard Error of Mean)، شاخصی برای سنجش خطای برآوردگر و توصیفی از روش نمونه‌گیری تصادفی است.

نمودار انحراف معیار زیر ذره بین

انحراف استاندارد از داده‌های حاصل از جامعه یا نمونه آماری تولید می‌شود. در مقابل، خطای استاندارد میانگین، یک عبارت احتمالی در مورد نسبت اندازه نمونه و انحراف استاندارد نمونه‌ای است. این شاخص، با توجه به «قضیه حد مرکزی» (Central Limit Theorem)، سعی در اندازه‌گیری خطای برآورد میانگین جامعه آماری دارد.

به عبارت ساده، خطای استاندارد میانگین نمونه، تخمین می‌زند که میانگین نمونه از میانگین جمعیت تا چه حد دور یا نزدیک است. در مقابل انحراف استاندارد شاخصی است که متوسط اختلاف مقادیر از میانگین نمونه یا جامعه آماری را نشان می‌دهد.

اگر انحراف استاندارد جمعیت متناهی باشد، خطای استاندارد میانگین نمونه با افزایش حجم نمونه به صفر می‌رسد، زیرا برآورد میانگین جمعیت بهبود می‌یابد، در حالی که انحراف استاندارد (نمونه یا جامعه) اغلب با اضافه شدن مشاهده جدید به داده‌ها، افزایش می‌یابد.

به این ترتیب مشخص است که باید بین انحراف استاندارد و خطای استاندارد تفاوت قائل شد. در ادامه توضیحات بیشتری نیز ارائه می‌شود.

انحراف استاندارد یک شاخص توصیفی

همانطور که گفته شد، انحراف استاندارد ابزاری برای نمایش میزان پراکندگی داده‌ها است. شیوه محاسبه «انحراف استاندارد» درست شبیه «واریانس» (Variance) است. به فرمول زیر توجه کنید. در نظر بگیرید که جامعه‌ای شامل NN مقدار مختلف مانند x1,x2,,xNx_1, x_2 , \ldots, x_N داریم و می‌خواهیم واریانس و انحراف استاندارد را محاسبه کنیم.

 Var(x)=1Ni=1N(xix)2  \large \text{Var}(x) = \frac{1}{N} \sum_{i = 1}^N (x_i - \overline{x} )^2

که در آن xˉ\bar{x}، میانگین مقادیر XX است. براساس واریانس، انحراف استاندارد بدست می‌آید.

 sd(x)=Var(x)  \large \text{sd}(x) = \sqrt{\text{Var}(x)}

البته شایان ذکر است که اگر به جای جامعه آماری، مشاهدات حاصل از یک نمونه‌ای آماری از جامعه بودند، محاسبه واریانس و انحراف استاندارد کمی با تغییر همراه بود. نحوه محاسبه واریانس نمونه‌ای و انحراف استاندارد نمونه‌ای در ادامه دیده می‌شود.

در اینجا فرض بر این است که یک نمونه nn تایی از جامعه آماری به صورت X1,X2,,XnX_1,X_2 ,\ldots,X_n در اختیارمان قرار گرفته است.

نکته: توجه داشته باشید که در فرمول مربوط به واریانس یا انحراف معیار جامعه از xx استفاده کردیم، زیرا متغیر تصادفی نیستند. ولی برای محاسبه واریانس و انحراف معیار نمونه‌ای از نماد XX استفاده می‌شود تا نشان دهنده تصادفی بوده آن‌ها باشد، زیرا مقدار آن‌ها از نمونه‌ای به نمونه دیگر متفاوت است.

 Var(X)=1n1i=1n(XiX)2  \large \text{Var}(X) = \frac{1}{n-1} \sum_{i = 1}^n (X_i - \overline{X} )^2

و همچنین برای انحراف معیار نمونه‌ای نیز همان ارتباط با واریانس را خواهیم داشت.

 sd(X)=Var(X)  \large \text{sd}(X) = \sqrt{\text{Var}(X)}

نکته: در مخرج محاسبه واریانس نمونه‌ای از n1n-1 استفاده شده تا یک «برآوردگر نااریب» (Unbiased Estimator) حاصل شود.

موضوع مهم در محاسبه واریانس و انحراف معیار، استفاده از میانگین به عنوان یک نقطه مرکزی و سنجش مجموع مربعات فاصله‌های مقادیر دیگر نسبت به آن است. در این حالت فقط از معیار مرکزی برای انجام محاسبات استفاده شده ولی برای برآورد آن، این عمل صورت نگرفته است و مستقیما براساس انحراف استاندارد بدست می‌آید.

تصویر تزئینی انحراف استاندارد و خطای استاندارد

خطای استاندارد میانگین

نمونه‌گیری از جامعه آماری با هدف برآورد پارامترها و شناخت آن جامعه صورت می‌پذیرد. به این ترتیب میانگین حاصل از یک نمونه تصادفی به اسم X\overline{X} می‌تواند برآورد مناسبی برای میانگین جامعه آماری باشد. ولی از آنجایی که مقدار این برآورد از نمونه‌ای به نمونه دیگر متفاوت است، آن را یک «متغیر تصادفی» (Random Variable) یا  «آماره» (Statistics) می‌نامیم.

پس مشخص است که برآورد میانگین که توسط یک نمونه تصادفی حاصل شده، دارای خطا است. این خطا توسط «خطای استاندارد میانگین» (Standard Error) اندازه گیری می‌شود.

بنابراین باید مشخص کنیم که اگر μ\mu میانگین واقعی برای جامعه آماری باشد، برآورد آن یعنی X\overline{X} چقدر از آن فاصله دارد. این فاصله را می‌توان به وسیله واریانس معرفی و محاسبه کرد.

البته می‌دانیم که انتظار داریم میانگین برآوردگرها (Xˉ\bar{\overline{X}}) به میانگین واقعی نزدیک و تقریبا با آن فاصله‌ای نداشته باشد. این ویژگی را برای یک برآوردگر، «نااریبی» (Unbiasness) می‌نامند. پس به این ترتیب داریم:

μ=E(X) \large \mu = E(\overline{X})

که در آن EE، نماد یا عملگر «امید ریاضی» (Mathematical Expectation) یا «مقدار مورد انتظار» (Expected Value) یا چشم داشتی است. حال فاصله برآوردگر از پارامتر یا مقدار مورد انتظار را برحسب واریانس محاسبه می‌کنیم. طبق تعریف واریانس مجموع متغیرهای تصادفی مستقل داریم:

Var(Xi)=Var1ni=1n(Xi)=1n2i=1nVar(Xi)=nσ2n2=σ2n\large \text{Var}(\overline{X_i}) = \text{Var}\frac{1}{n}\sum_{i = 1}^n ({X_i}) = \frac{1}{n^2}\sum_{i=1}^n \text{Var}(X_i) = \dfrac{n\sigma^2}{n^2}=\frac{\sigma^2}{n}

از طرفی انحراف معیار براساس این واریانس نیز به صورت زیر حاصل می‌شود.

SE(X)=Var(X)=σn \large SE(\overline{X}) = {\sqrt {\text{Var}}(\overline{X})} = \frac{\sigma}{\sqrt{n}}

رابطه محاسبه خطای استاندارد میانگین برحسب انحراف معیار

توجه داشته باشید که اگر انحراف معیار جامعه (σ\sigma) مشخص نباشد، باید از برآوردگر انحراف معیار نمونه‌ای استفاده کرد. البته این کار احتیاج به یک ضریب تصحیح نیز دارد که در ادامه این مطلب به آن اشاره خواهیم کرد.

 نکته: همانطور که مشاهده می‌شود، با افزایش تعداد نمونه‌ها، واریانس خطای میانگین و در نتیجه خطای استاندار میانگین، کاهش می‌یابد. زیرا اثر افزایش تعداد، دوبار تاثیر گذار است. یکبار در محاسبه واریانس یا انحراف استاندارد نمونه‌ای که مجموع مربعات به تعداد تقسیم می‌شود و یکبار هم هنگام محاسبه خطای استاندارد میانگین، عمل تقسیم صورت می‌گیرد.

ضریب تصحیح جامعه متناهی و همبستگی نمونه‌ای

محاسبه خطای استاندارد میانگین به دلیل اهمیت آن در برآورد میانگین و اندازه خطای آن، باید با دقت صورت گیرد. در این میان دو دلیل برای به کار بردن ضریب تصحیح وجود دارد که اولی متناهی بودن جامعه آماری و دومی همبستگی بین نمونه‌های تصادفی است. ابتدا ضریب تصحیح جامعه متناهی را توضیح داده، سپس به بررسی همبستگی نمونه‌ها خواهیم پرداخت.

نمودار انحراف معیار روی تخته سیاه کلاسی رسم شده اند

ضریب تصحیح برای محاسبه انحراف استاندارد و خطای استاندارد

معمولا هنگام محاسبه انحراف معیار و خطای استاندارد میانگین، فرض بر این است که اندازه جامعه (NN) بسیار بزرگ بوده و در مقابل، حجم نمونه (nn) کوچک است. ولی اگر حجم نمونه بزرگ باشد و بیش از ۵٪ جامعه آماری را شامل شود، بهتر است انحراف استاندارد و خطای استاندارد میانگین را به کمک یک ضریب تصحیح، بهینه کرد. این ضریب برای هر یک از این شاخص‌ها به صورت زیر نوشته می‌شود.

NN1 \large {\displaystyle {\sqrt{\dfrac{N}{N - 1}} }}

ضریب تصحیح جامعه متناهی برای انحراف استاندارد

FPC=NnN1 \large {\displaystyle {\text{FPC}} = {\sqrt {\frac {N - n}{N - 1}}}}

ضریب تصحیح جامعه متناهی برای خطای استاندارد میانگین

بر اساس رای ۳۷ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
مجله فرادرس
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *