میانگین پیراسته — به زبان ساده

۴۴۸۳ بازدید
آخرین به‌روزرسانی: ۱۴ شهریور ۱۴۰۲
زمان مطالعه: ۲ دقیقه
میانگین پیراسته — به زبان ساده

همانطور که میانگین برای محاسبه مقدار معدل داده‌ها به کار می‌رود،‌ «میانگین پیراسته» (Trimmed Mean) یا «میانگین بریده‌شده» (Truncated Mean) نیز معدل را برای بخشی از داده‌ها محاسبه می‌کنند که شامل «داده‌های دورافتاده» (Outlier) نیستند. مقادیر دورافتاده باعث می‌شوند که میانگین به سمت آن‌ها منحرف شود در حالیکه میانگین پیراسته در مقابل آن‌ها «استوار» (Robust) است. زمانی که توزیع داده‌ها دارای چولگی باشد، میانگین پیراسته برآورد بهتری نسبت به میانگین حسابی برای مرکز ثقل داده‌ها است.

فهرست مطالب این نوشته

برای حذف نقاط دورافتاده از پارامتری به نام «درصد» (P) استفاده می‌کنیم. این مقدار نشان می‌دهد که چه درصدی از بزرگترین و کوچکترین داده‌ها باید برای محاسبه میانگین پیراسته حذف شوند.

برای مثال، اگر این پارامتر برابر با ۵٪ باشد، برای محاسبه میانگین پیراسته از n مشاهده، ۵٪×n از بزرگترین و ۵٪×n از کوچکترین مقادیر حذف شده و از مابقی (90٪×n داده‌ها) میانگین حسابی گرفته می‌شود.

بطور معمول مقدار این درصد بین ۵٪ تا ۲۵٪ در نظر گرفته می‌شود. گفتنی است که برای محاسبه‌ میانگین پیراسته مراحل زیر باید طی شود:

  1. داده‌ها از کوچک به بزرگ مرتب شوند.
  2. صدک Pام را محاسبه شود.
  3. صدک $$(1-P)$$ نیز مورد محاسبه قرار می‌گیرد.
  4. مقدارهای کوچکتر یا مساوی با صدک Pام و بزرگتر از صدک $$(1-P)$$ حذف شوند.
  5. از مابقی داده‌ها، میانگین حسابی محاسبه شود.

البته در صورتی‌که داده‌ها از کوچک به بزرگ مرتب شده باشند از فرمول زیر نیز می‌توان میانگین پیراسته را محاسبه کرد:

$$Trimmed Mean= \frac{\sum_{(n\times P) +1}^{n\times (1-P)} x_i}{n\times(1-2P)}$$

مثال

میانگین پیراسته برای 5 مقدار 81،83،60،91،99 با پارامتر ۲۰٪ طبق مراحل بالا به این شکل اجرا می‌شود:

  1. مرتب سازی: 60،81،83،91،99
  2. محاسبه صدک ۲۰ام: 5×20٪= 1 در نتیجه کوچکترین مقدار صدک ۲۰ام است.
  3. محاسبه صدک ۸۰ام: 5×80٪=4 در نتیجه چهارمین مقدار صدک ۸۰ام است.
  4. اولین مقدار و ۵امین مقدار حذف می‌شوند. (مقدارهای کوچکتر یا مساوی از اولین مقدار و مقدارهای بزرگتر از ۴امین مقدار)
  5. از مابقی میانگین حسابی گرفته می‌‌شود. $$(81+83+91)/3= 85$$

نکته: اگر مقدارهایی که از صدکPام کوچکتر یا مساوی بودند با کوچکترین داده از مقدارهای باقی مانده جایگزین شوند و مقدارهایی که از صدک $$(1-P)$$ بزرگتر بودند با بزرگترین داده از مقدارهای باقی‌مانده جایگزین شوند، به میانگین حاصل از این داده‌ها، «میانگین وینزوری» (Winsorised mean) می‌گویند. در این حالت براساس مثال بالا میانگین وینزوری داده‌های 60،81،83،91،99 به صورت میانگین حسابی برای داده‌های 81،81،83،91،91 محاسبه می‌شود که نتیجه برابر با 85.4 خواهد بود.

نکته: در شرایطی که پارامتر P‌ برابر با 25٪ باشد، به میانگین پیراسته، «میانگین بین چارکی» (InterQuartile Mean- IQM) نیز گفته می‌شود.

نکته: گاهی در بعضی از نرم‌افزارهای محاسبات آمار، درصد (P) بیانگر درصد کل داده‌های حذفی است، بنابراین P/2 از کوچکترین و P/2 از بزرگترین داده‌ها حذف می‌شود و از مابقی میانگین حسابی گرفته می‌شود.

اگر مطلب بالا برای شما مفید بوده است، احتمالاً آموزش‌هایی که در ادامه آمده‌اند نیز برایتان کاربردی خواهند بود.

^^

بر اساس رای ۳۵ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
Wikipedia
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *