استفاده از میانگین حسابی زمانی که یک یا چند مقدار دور از اکثر داده‌ها باشند، صحیح نیست، زیرا «نقاط دور افتاده» (Outlier)، میانگین حسابی را به سمت خودشان منحرف می‌کنند و نمی‌توان معیار خوبی برای مرکز ثقل داده‌ها پیدا کرد. در چنین مواقعی بهتر است از «سه-میانگین» (Trimean) کمک گرفت.

این میانگین توسط آماردان برجسته آمریکایی «جان توکی» ابداع شده است. سه-میانگین با عبارت «Trimean» نشان داده می‌شود و شیوه محاسبه آن طبق رابطه زیر است:

$$Trimean=\frac{Q_1+2Q_2+Q_3}{4}$$

که در آن Q1 چارک اول، Q2 چارک دوم و Q3‌ چارک سوم هستند. این شیوه برای محاسبه میانگین، به نقاط مرکزی بیش از نقاط انتهایی اهمیت می‌دهد.

مراحل محاسبه سه-میانگین به صورت زیر است:

  1. مقادیر، کوچک به بزرگ مرتب شود.
  2. مقدارهای چارک اول و دوم و سوم از لیست مرتب شده مقادیر بدست آید.
  3. براساس فرمول، سه-میانگین محاسبه شود.

برای آشنایی بیشتر با مفهوم و شیوه محاسبه چارک‌‌ها، می‌توانید به مطلب صدک ها – مفاهیم ریاضی به زبان ساده مراجعه کنید.

نکته: مقدار چارک دوم همان مقدار میانه است.

مثال

مقدار سه-میانگین برای مقدارهای 1،5،6،4،10 طبق مراحل گفته شده در بالا محاسبه می‌شود.

  1. مرتب سازی: 1،4،5،6،10
  2. Q۱=۴، Q۲=۵، Q۳=۶
  3. $$Trimean=\frac{4+2 \times 5 + 6}{4} = \frac{20}{4}=5$$

درحالیکه میانگین حسابی برای این اعداد برابر با 5.2 خواهد بود. تاثیر مقدار ۱ و ۱۰ که نسبت به بقیه داده‌ها دور هستند، در میانگین حسابی دیده می‌شود.

از مزایای استفاده از سه-میانگین،‌ سادگی محاسبه آن است. همچنین با وجود داد‌ه‌های دورافتاده، این میانگین می‌تواند برآورد بهتری برای مرکز ثقل داده‌ها نسبت به میانگین حسابی ارائه دهد، زیرا تحت تاثیر آنها قرار نمی‌گیرد. این خاصیت را مقاومت یا «استواری» (Robust) در برابر نقاط دورافتاده می‌گویند. برای تشخیص اینکه آیا در داده‌ها مقدار دورافتاده وجود دارد، می‌توانید به آموزش تشخیص داده های پرت مراجعه کنید.

اگر مطلب بالا برای شما مفید بوده است، احتمالاً آموزش‌هایی که در ادامه آمده‌اند نیز برایتان کاربردی خواهند بود.

^^

بر اساس رای ۶ نفر
آیا این مطلب برای شما مفید بود؟
شما قبلا رای داده‌اید!
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مشاهده بیشتر