برآوردگر M یا M-Estimator — به زبان ساده
در آمار و روشهای برآوردیابی، برآوردگر ام (M-Estimator) در گروه برآوردگرهایی قرار میگیرد که براساس بیشینهسازی یک تابع هدف برحسب میانگین نمونه تصادفی حاصل میشوند. برآوردیابی حداکثر درستنمایی (Maximum Likelihood Estimation) و حداقل مربعات عیر خطی حالت خاصی از برآوردگر ام محسوب میشوند. برای آنکه خواندن نام این برآوردگر در فارسی راحتتر شود از این به بعد آن را برآوردگر M یا M-Estimator و شیوهای که برای بدست آوردن این برآوردگر به کار میرود را برآوردیابی M مینامیم.
برای آشنایی بیشتر با شیوه برآوردیابی و استفاده از تابع درستنمایی بهتر است نوشتار تابع درست نمایی (Likelihood Function) و کاربردهای آن — به زبان ساده را مطالعه کنید. همچنین خواندن آماره کامل و آماره کمکی — به زبان ساده نیز خالی از لطف نیست.
برآوردگر M یا M-Estimator
انگیزه ایجاد برآوردگر M، آن است که بتوان به یک برآوردگر استوار (Robust) دست یافت که حتی برای دادههایی خارج از توزیع نرمال نیز قابل اتکا باشد. معمولا برآوردگر M براساس صفر شدن یک تابع برحسب برآوردگر حاصل میشود. تابع برآوردگر (Estimating Function) اغلب مشتق یک تابع آماری دیگر است.
برای مثال برآورد حداکثر درستنمایی (Maximum Likelihood Estimate)، نقطهای را پیدا میکند که در آن مشتق تابع درستنمایی نسبت به پارامتر، صفر باشد. واضح است که در این حالت برآوردگر درستنمایی یک نقطه بحرانی برای «تابع امتیاز» (Score Function) است. به این ترتیب میتوان برآوردگرهای M را به عنوان مشخصه جامعه آماری در نظر گرفت.
نکته: معمولا به مشتق لگاریتم تابع درستنمایی نسبت به پارامتر مجهول، تابع امتیاز یا Score Function میگویند.
تعریف برآوردگر M
میتوان برآوردگر M را الگویی برای روش حداقل مربعات (Least Square) در نظر گرفت، زیرا مبنای پیدا کردن برآوردگر در این روش، کمینهسازی یک تابع هدف است. همچنین روش حداکثر درستنمایی (ML) نیز در گروه برآوردگر M یا M-Estimator قرار میگیرد. بنابراین اگر را تابع چگالی یک توزیع و را پارامتر توزیع در نظر بگیریم، برآوردگر حداکثر درستنمایی، نقطهای است که در رابطه زیر صدق کند. چنین برآوردگری را معمولا به صورت MLE یا Maximum Likelihood Estimator نشان میدهند.
یا به صورت مشابه میتوان رابطه زیر را برای این برآوردگر در نظر گرفت.
نکته: از خصوصیات جالب برای برآوردگرهای درستنمایی میتوان به سازگاری آنها اشاره کرد. به این معنی که با افزایش تعداد نمونه، برآوردگر حاصل از روش حداکثر درستنمایی به پارامتر جامعه میل خواهد کرد. ولی این امر ممکن است برای اندازه نمونههای کوچک صادق نباشد.
هوبر (Peter Huber) در سال ۱۹۶۴، برآوردگرهای حداکثر درستنمایی تعمیم یافته (Generalize Maximum Likelihood Estimator) را به شکلی معرفی کرد که تابع زیر را کمینه سازند.
رابطه ۱
بطوری که رابطه زیر برقرار باشد.
رابطه ۲
در این بین تابع دارای خصوصیاتی است که در ادامه فهرست شده است.
- این تابع نامنفی است و مقدار کمینه آن صفر خواهد بود.
- تابع یک تابع زوج است.
- این تابع نسبت به پارامترش یعنی یک تابع صعودی است. ولی شدت رشد آن به میزان رشد نیست.
انواع برآوردگر M
همانطور که در قسمت قبل بیان شد، برآوردگر M از طریق کمینه سازی تابع حاصل میشود.
اگر این تابع را براساس یک نمونه تصادفی تایی، ایجاد کنیم، خواهیم داشت:
کمینهسازی این تابع ممکن است به روش مستقیم صورت گیرد. البته شاید سادهتر باشد که بوسیله مشتقگیری نسبت به و حل معادله و بدست آوردن ریشههای معادله برحسب مشتق، به مقدار کمینه و در نتیجه برآوردگر M برسیم. ولی شاید مشتق تابع به سادگی صورت نگیرد و یا امکان حل معادله وجود نداشته باشد.
در زمانی که به روش مشتقگیری به پاسخی برای ریشههای مشتق تابع میرسیم، برآوردگر M را «نوع » یا ( Type) مینامند. در غیر اینصورت اگر کمینهسازی به روشهای دیگر صورت گیرد، برآوردگر M را «نوع » یا ( Type) میگویند.
در اغلب موارد برآوردگر M از نوع است.
برآوردگر M از نوع
زمانی که تابع مشتقپذیر باشد، بدست آوردن برآوردگر M برای پارامتر ساده خواهد بود. هر چند ممکن است مشتقگیری مراحل طولانی و زمانبری داشته باشد ولی به هر حال با بدست آوردن مشتق و برابر قرار دادن آن با صفر، به یک معادله خواهیم رسید که برآوردگر M ریشههای این معادله خواهند بود.
فرض کنید که یک برآوردگر M برای پارامتر باشد. به این ترتیب میتوان تابع را به صورت زیر در نظر گرفت:
در این جا یک تصویر از تابع توزیع احتمال به فضای پارامتر ایجاد میکند.
به این ترتیب دستگاه معادلاتی که باید حل شوند به شکل زیر خواهند بود.
برای مثال، برآوردگر حداکثر درستنمایی به شکل زیر نوشته خواهد شد به شرطی که تابع چگالی موجود بوده یعنی .
به این ترتیب اگر تابع پیوسته و دارای مشتق مرتبه اول برحسب باشد، آنگاه شرط لازم برای آنکه برآوردگر M از نوع باشد آن است که:
برآوردگر نوع
فرض کنید که و فضای اندازهپذیر براساس مقادیر صحیح باشند. از طرفی نیز برداری از پارامترها است که علاقمند به برآورد کردن آنها هستیم. برآوردگر M از نوع را که با نشان میدهیم، بوسیله تابع به صورت زیر تعریف میشود.
آنگاه مقدار انتگرال زیر را کمینه میسازد.
به این ترتیب خواهیم داشت:
برای مثال برآوردگر حداکثر درستنمایی، همان برآوردگر M است اگر:
و
نیز تابع چگالی احتمال باشد.
خصوصیات برآوردگر M
فرض کنید که با مشاهده از متغیر تصادفی مواجه هستید. از آنجایی که این مشاهدات از یکدیگر مستقل و هم توزیع با هستند، برآوردگر حداکثر درستنمایی که تابع زیر را بیشینه سازد، برآوردگر درستنمایی یا همان برآوردگر M خواهد بود.
واضح است که برای حداکثر سازی این تابع میتوان از مشتق استفاده کرد. با توجه به اینکه به ازاء همه مقادیر و مثبت است، میتوانیم تابع را به صورت زیر در نظر بگیریم.
به این ترتیب در یک نمونه متناهی، برآوردگر M تعریف میشود. ولی در حالت کلی میتوان با توجه به رابطه ۱ و ۲، برآوردگر M را تعریف کرد. متاسفانه پیدا کردن تابع همیشه به سادگی صورت نمیگیرد. به همین دلیل کمتر از برآوردگر M استفاده میشود.
میتوان نشان داد که برآوردگر M بطور مجانبی دارای توزیع نرمال است. به این ترتیب میتوان فواصل اطمینان و آزمون فرض را با استفاده از «رویکرد والد» (Wald Approach) تشکیل داد. همچنین «تابع اثر» (Influence Function) برای یک برآوردگر M از نوع متناسب با تابع است. در نظر بگیرید که یک تابع توزیع احتمال و نیز یک برآوردگر M برای پارامتر باشد. تابع اثر که با نشان داده میشود به صورت زیر خواهد بود.
در رابطه بالا به خوبی دیده میشود که تابع اثر با تابع در یک تناسب است و مخرج این نسبت نیز امید ریاضی مشتق تابع برحسب است. البته فرض بر این است که تابع چگالی توزیع وجود دارد و با نشان داده است.
از برآوردگر M در برآورد کردن پارامترهای مکان و مقیاس میتوان استفاده کرد. همچنین در «رگرسیون استوار» (Robust Regression) نیز از برآوردگر M برای پارامترهای مدل استفاده میشود.
برآوردگر M برای میانگین و میانه
فرض کنید () یک نمونه تصادفی مستقل و همتوزیع (Independent Identical Distribution) یا iid با توزیع باشند. را به صورت زیر در نظر بگیرید:
واضح است که زمانی این تابع به حداقل مقدار خود میرسد که با میانگین ها برابر باشد. در نتیجه میانگین نمونه تصادفی یک برآوردگر M برای خواهد بود.
واضح است که در این بین یک تابع مشتقپذیر و پیوسته برحسب است. به این ترتیب میتوان میانگین را یک برآوردگر M از نوع با به صورت زیر در نظر گرفت.
برآوردگر M برای میانه
باز هم یک نمونه تصادفی از توزیع را به شکل ، مستقل و همتوزیع در نظر بگیرید. به منظور برآورد میانه (Median) این توزیع، تابع را برای محاسبات بعدی به صورت زیر در نظر میگیریم.
به این ترتیب مقدار کمینه برای این تابع در نقطهای حاصل میشود که میانه ها باشد. از آنجایی که تابع در این حالت مشتقپذیر نیست، میتوانیم تابع را برحسب زیرمشتق تابع در نظر گرفته و به این ترتیب خواهیم داشت:
در نتیجه
$$\large {\displaystyle \psi (x,\theta )={\begin{cases}\{-1\},&{\mbox{if }}x-\theta <0\\\{1\},&{\mbox{if }}x-\theta >0\\\left[-1,1\right],&{\mbox{if }}x-\theta =0\end{cases}}}$$
برآوردگر M برای مدل رگرسیونی
فرض کنید که در یک مدل رگرسیونی خطی عادی (ordinary Least Square Regression Model) بخواهیم پارامترها را برآورد کنیم.
در این حالت تابع را میتوان به صورت زیر در نظر گرفت.
بوسیله مشتقگیری از این تابع به تابع خواهیم رسید. پس کافی است که معادله زیر را برای پیدا کردن برآوردگر M پارامترهای به کار ببریم.
حال اگر به جای استفاده از رگرسیون خطی عادی (OLS) یا (Ordinary Least Square Error) که معمولا از توابع خطای مربع زیان (MSE) یا (Mean Square Error) استفاده میشود، از تابع حداقل قدر مطلق تفاضل (LAD) یا (Least Absolute Difference) بهره میبردیم، به یک برآوردگر M دیگر برای پارامترهای مدل رگرسیونی دست مییافتیم.
خلاصه و جمعبندی
در این نوشتار به بررسی برآوردگر M یا M-Estimator پرداختیم و انواع آن را مورد بررسی قرار دادیم. همچنین شیوه بدست آوردن آن را براساس یک مثال برای میانگین و میانه جامعه آماری مرور کردیم. با توجه به اینکه ممکن است جامعه آماری، از توزیع نرمال برخوردار نباشد، برآورد پارامترها از طریق برآوردگرهای M دارای استواری (Robust) بیشتری نسبت به به روشهای عادی برآوردگریابی مانند روش گشتاوری است.
جدول زیر به بررسی چند تابع و نوع تابع اثر پرداخته است. ستون اول تابع زیان و ستون دوم نیز تابع را نشان میدهد. همچنین تابع اثر نیز در ستون آخر مشخص شده است.
نوع تابع زیان | ||
مربع خطا () | ||
قدر مطلق خطا () | ||
تابع زیان |
اگر این مطلب برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات
- آموزش آمار و احتمال مهندسی
- مجموعه آموزشهای SPSS
- استنباط و آزمون فرض آماری — مفاهیم و اصطلاحات
- متغیر تصادفی و توزیع پواسن — به زبان ساده
- متغیر تصادفی و توزیع دو جملهای — به زبان ساده
^^