خطای جذر میانگین مربعات چیست و چگونه محاسبه می شود؟ – به زبان ساده

۷۵ بازدید
آخرین به‌روزرسانی: ۲۷ مرداد ۱۴۰۳
زمان مطالعه: ۷ دقیقه
خطای جذر میانگین مربعات چیست و چگونه محاسبه می شود؟ – به زبان ساده

پس از طراحی، پیاده‌سازی و آموزش، باید نتیجه یا همان پیش‌بینی مدل یادگیری ماشین مورد ارزیابی قرار بگیرد. از جمله معیارهای کاربردی و رایج برای سنجش کیفیت عملکرد مدل، می‌توان به «خطای جذر میانگین مربعات» (Root Mean Square Error | RMSE) اشاره کرد. معیار ارزیابی RMSE میزان تطابق منحنی تابع با داده‌ها یا فاصله پیش‌بینی‌ها با مقادیر حقیقی را اندازه می‌گیرد. در این مطلب از مجله فرادرس، می‌آموزیم خطای جذر میانگین مربعات چیست و با نحوه محاسبه RMSE آشنا می‌شویم. معیاری که محاسبه دقیق آن برای تضمین کیفیت مدل یادگیری ماشین ضرورت دارد.

997696

در این مطلب ابتدا یاد می‌گیریم خطای جذر میانگین مربعات چیست و  مثالی از نحوه کارکرد آن در مسائل حقیقی ارائه می‌دهیم. سپس با فرمول محاسبه RMSE آشنا می‌شویم و در انتهای این مطلب از مجله فرادرس به معرفی چند مورد از نقاط قوت و ضعف این معیار ارزیابی می‌پردازیم.

خطای جذر میانگین مربعات چیست؟

خطای جذر میانگین مربعات معیاری است که تفاضل میان مقادیر پیش‌بینی شده و حقیقی را اندازه‌گیری می‌کند. از نظر ریاضیاتی معیار RMSE برابر انحراف معیار «مقادیر باقیمانده» (Residuals) است. مقادیر باقیمانده بیانگر فاصله میان خط رگرسیونی و نقاط داده هستند. در واقع خطای جذر میانگین مربعات یا RMSE، میزان پراکندگی مقادیر باقیمانده یا همان نزدیکی مقادیر حقیقی به پیش‌بینی شده را اندازه می‌گیرد. برای آشنایی بیشتر با مباحث ریاضیاتی یادگیری ماشین، می‌توانید فیلم آموزش ریاضی برای یادگیری ماشین فرادرس را که در ادامه آورده شده است مشاهده کنید:

فاصله میان مقادیر حقیقی و پیش بینی شده
فاصله میان مقادیر حقیقی و پیش‌بینی شده

هر چه نقاط داده به خط رگرسیونی نزدیک‌تر باشند، یعنی خطای مدل و در نتیجه RMSE کمتر است. مدلی که خطای کمتری داشته باشد، نتایج و پیش‌بینی‌های دقیق‌تری تولید می‌کند. دامنه مقادیر حاصل از RMSE از صفر تا مثبت بی‌نهایت متغیر است و همچنین واحد اندازه‌گیری یکسانی با متغیر وابسته یا هدف دارد. از خطای جذر میانگین مربعات برای سنجش میزان خطا در رگرسیون و دیگر مدل‌های آماری استفاده می‌شود. اگر خطا برابر با ۰ باشد، یعنی مقادیر پیش‌بینی شده با مقادیر حقیقی یکسان هستند که احتمال چنین رخدادی بسیار پایین و بعید است.

پایین بودن مقدار RMSE نشان دهنده این است که مدل یادگیری ماشین به‌خوبی بر داده‌ها برازش شده و پیش‌بینی‌هایی با دقت بالا نتیجه می‌دهد. به‌طور متقابل، مقادیر بالا RMSE بیانگر خطا بیشتر و کیفیت پایین پیش‌بینی‌ها هستند. متخصصان علم داده از خطای جذر میانگین مربعات در زمینه‌های مختلفی همچون اقلیم‌شناسی، پیش‌بینی آب و هوا، اقتصاد و امور مالی بهره می‌برند. خطای جذر میانگین مربعات یا RMSE معیار ارزیابی مهمی در «مدل‌سازی پیش‌بین» (Predictive Modeling) و آگاهی از عملکرد مدل یادگیری است.

آموزش یادگیری ماشین با فرادرس

مجموعه فیلم های آموزش یادگیری ماشین مرتبط با فرادرس
برای دسترسی به مجموعه فیلم‌های آموزش داده کاوی و یادگیری ماشین، روی تصویر کلیک کنید.

یادگیری ماشین یک حوزه گسترده و پیچیده است که به یک رویکرد ساختاریافته برای یادگیری نیاز دارد. یک مسیر جامع برای آموزش یادگیری ماشین از سه بخش زیر تشکیل می‌شود:

  1. آموزش مفاهیم آماری:‌ در این مرحله، شما با مفاهیم پایه‌ای آمار و احتمال آشنا می‌شوید که اساس یادگیری ماشین را تشکیل می‌دهند. یکی از مهم‌ترین این مفاهیم، معیارهای ارزیابی مدل مانند خطای جذر میانگین مربعات (RMSE) است. درک عمیق این مفاهیم به شما کمک می‌کند تا بتوانید عملکرد مدل‌های خود را به درستی ارزیابی کنید و تصمیمات آگاهانه‌تری در فرآیند طراحی و آموزش مدل بگیرید.
  2. آموزش کتابخانه‌های مهم: پس از آشنایی با مفاهیم پایه، نوبت به یادگیری ابزارهای عملی می‌رسد. در این مرحله، شما با کتابخانه‌های کاربردی پایتون مانند Scikit-learn آشنا می‌شوید. این کتابخانه‌ها امکان پیاده‌سازی سریع و کارآمد الگوریتم‌های یادگیری ماشین را فراهم می‌کنند. شما یاد می‌گیرید چگونه از این ابزارها برای پردازش داده‌ها، ساخت مدل‌ها و ارزیابی نتایج استفاده کنید.
  3. آموزش کاربردی یادگیری ماشین: در قدم آخر، دانش نظری و مهارت‌های عملی خود را در پروژه‌های واقعی به کار می‌گیرید. این بخش شامل کار با مجموعه داده‌های واقعی، حل مسائل پیچیده و پیاده‌سازی راه‌حل‌های یادگیری ماشین برای چالش‌های جهان حقیقی است. شما یاد می‌گیرید چگونه از تکنیک‌های پیشرفته برای بهبود عملکرد مدل‌ها استفاده و با مشکلاتی مانند بیش‌برازش و کم‌برازش مقابله کنید.

پلتفرم فرادرس برای هر کدام از بخش‌های عنوان شده مجموعه فیلم‌های آموزشی را در اختیار شما قرار می‌دهد که با مشاهده آن‌ها از طریق لینک‌های زیر می‌توانید به تدریج مهارت‌های خود را در حوزه یادگیری ماشین گسترش دهید:

مثالی از خطای جذر میانگین مربعات

حالا که می‌دانیم منظور از خطای جذر میانگین مربعات چیست، در این بخش با شرح مثالی کاربردی، بیشتر و عمیق‌تر با نحوه کارکرد این معیار ارزیابی آشنا می‌شویم. فرض کنید می‌خواهیم برای پیش‌بینی نمرات نهایی دانش‌آموزان یک مدل رگرسیونی طراحی کنیم. متغیر وابسته یا هدف در این مسئله همان نمرات کسب شده از امتحان است. همچنین دو معیار میزان ساعت مطالعه و نمرات میان‌ترم را به عنوان متغیرهای مستقل در نظر می‌گیریم. اگر مقدار RMSE به‌دست آمده از ارزیابی مدل را ۴ فرض کنیم، یعنی اختلافی به اندازه ۴ نمره میان پیش‌بینی مدل و نمرات اصلی دانش‌آموزان وجود دارد. در حقیقیت با مقایسه این دو مقدار می‌توانیم به کارایی مدل رگرسیون پی‌ببریم.

نموداری با نقاط داده پراکنده که بیانگر مثالی از خطای جذر میانگین مربعات است

به عنوان مثال اگر دامنه نمرات نهایی از ۰ تا ۱۰۰ متغیر باشد، خطای RMSE با مقدار ۴ به ما می‌گوید که پیش‌بینی‌های مدل دقت بالایی داشته و نرخ خطای میانگین تنها ۴ درصد است. در ادامه می‌توانیم بررسی کنیم که آیا این حد از خطا برای نیاز و مسئله ما ایده‌آل است یا خیر. همچنین از خطای جذر میانگین مربعات برای تخمین فاصله پیش‌بینی ۹۵ درصدی استفاده می‌شود. به بیان دیگر، اگر توزیع مقادیر باقیمانده نرمال باشد، به‌طور تقریبی ۹۵ درصد از داده‌های دیتاست در فاصله +/2×RMSE +/-2 \times RMSE از مقادیر پیش‌بینی شده قرار می‌گیرند. در مثال ما که RMSE برابر ۴ است، ۹۵ درصد از مقادیر اصلی، ۸ نمره با مقادیر پیش‌بینی شده فاصله دارند:

+/2×4=+/8 +/-2 \times 4 = +/-8

توجه داشته باشید که حتی با وجود خطای RMSE پایین، همچنان احتمال کم‌برازش شدن مدل وجود دارد. در نتیجه برای اطمینان از این موضوع لازم است تا نمودار مقادیر باقیمانده نیز بررسی شود.

فرمول محاسبه خطای جذر میانگین مربعات چیست؟

پس از پاسخ دادن به پرسش خطای جذر میانگین مربعات چیست و ارائه مثالی از نحوه کارکرد آن، در این بخش به شرح فرمول محاسبه معیار RMSE می‌پردازیم. شاید فرمول RMSE برای شما آشنا به‌نظر برسد، چرا که در واقع همان فرمول محاسبه انحراف معیار است. از طرفی خطای جذر میانگین مربعات همان انحراف معیارِ مقادیر باقیمانده است و پراکندگی مقادیر حقیقی را از پیش‌بینی شده اندازه می‌گیرد. فرمول محاسبه RMSE به شرح زیر است:

RMSE=(yiyi^)2NP RMSE = \sqrt{\frac{\sum(y_i - \hat{y_i})^2}{N - P}}

تعریف هر کدام از نماد‌های به‌ کار رفته در این فرمول عبارت است از:

  • yi y_i : مقدار حقیقی برای نمونه‌ای که در جایگاه i i اُم قرار دارد.
  • yi^ \hat{y_i} : مقدار پیش‌بینی شده برای نمونه‌ای که در جایگاه i i اُم قرار دارد.
  • N N : تعداد کل نمونه‌ها.
  • P P : تعداد پارامترهای تخمین زده شده از جمله ثابت‌ها.

برای به‌دست آوردن خطای جذر میانگین مربعات، باید مربع عبارت (yy^) (y - \hat{y}) برای هر نمونه محاسبه و سپس همه نتایج با یک‌دیگر جمع شوند. در ادامه، این عبارت بر «درجه آزادی» (Degree of Freedom) مدل یا همان (NP) (N - P) تقسیم شده و خطای میانگین مربعات (MSE) به‌دست می‌آید. در انتها و با جذر گرفتن از MSE، مقدار RMSE حاصل می‌شود. متخصصان علم آمار، صورت کسر فرمول RMSE را «مجموع مربعات» می‌نامند. دقت داشته باشید که اگر بخواهیم از کل داده‌های دیتاست استفاده کنیم، مخرج کسر برابر با N N خواهد بود. مطلب کامل‌تری درباره انواع معیارهای ارزیابی در مجله فرادرس نگارش شده است که با مراجعه به لینک زیر می‌توانید آن را مطالعه کنید:

حالا که به‌خوبی می‌دانیم خطای جذر میانگین مربعات چیست و چگونه محاسبه می‌شود، در بخش بعدی از این مطلب مجله فرادرس با نقاط قوت و ضعف این معیار ارزیابی آشنا می‌شویم.

نقاط قوت و ضعف خطای جذر میانگین مربعات

مانند هر معیار آماری دیگر، خطای جذر میانگین مربعات نیز نقاط قوت و ضعف منحصر به خود را دارد که در این بخش به برخی از آن‌ها اشاره می‌کنیم. در طول این بخش، معیار RMSE به‌طور مکرر با ضریب تعیین یا R-squared مقایسه می‌شود. زیرا هر دو کیفیت برازش مدل را در مقیاس‌های متفاوت مورد ارزیابی قرار می‌دهند. خطای جذر میانگین مربعات از مقیاسی استاندارد نشده در بازه ۰ تا مثبت بی‌نهایت و ضریب تعیین از مقیاسی استاندارد شده در بازه ۰ تا ۱۰۰ درصد بهره می‌برد. برخی از نقاط قوت RMSE عبارت‌اند از:

  • تفسیر قابل فهم: خطای جذر میانگین مربعات یا RMSE معیار ساده‌ایست که یک تفسیر قابل فهم از خطا مدل ارائه می‌دهد و حتی توسط افرادی که پیش‌زمینه محکمی در علم آمار ندارند به کار گرفته می‌شود. معیاری مطلق از فاصله میانگین نقاط داده تا مقادیر پیش‌بینی شده که واحد اندازه‌گیری یکسانی با متغیر وابسته دارد. با بهره‌گیری از این معیار، می‌توان دقت پیش‌بینی مدل را به صورت مستقیم اندازه گرفت. از طرف دیگر اما R-squared یک معیار نسبی (درصدی) بوده و برای اندازه‌گیری کیفیت برازش آن هم بدون واحدی مشخص مناسب است.
  • واحد استاندارد: معیار RMSE در بسیاری از زمینه‌ها یک واحد استاندارد به‌شمار می‌رود و برای ارزیابی عملکرد مدل یادگیری ماشین مورد استفاده قرار می‌گیرد.

ترازویی که نشان دهنده نقاط قوت و ضعف خطای جذر میانگین مربعات است

از جمله نقاط ضعف معیار ارزیابی RMSE می‌توان به موارد زیر اشاره داشت:

  • حساس به نمونه‌های پرت: عملیات به توان رساندن، باعث می‌شود تا خطای جذر میانگین مربعات وزن نامتناسب بیشتری به خطاهای بالا داده و در نتیجه، نسبت به دیگر معیارهای ارزیابی مانند MAPE و MSD، حساسیت بیشتری به نمونه‌های پرت داشته باشد.
  • حساس به بیش‌برازش: با هر بار اضافه شدن یک متغیر مستقل جدید به مدل، از خطای جذر میانگین مربعات کاسته می‌شود. با تنها اضافه کردن چند متغیر بیشتر -حتی اگر لزومی نداشته باشد- می‌توان از خطای RMSE کم کرد و همین موضوع، احتمال بیش‌برازش شدن مدل را افزایش می‌دهد. معیار R-squared نیز مانند RMSE با دو مشکل نمونه‌های پرت و بیش‌برازش مواجه است.
  • حساس به مقیاس: خطای جذر میانگین مربعات نسبت به متغیر وابسته حساس است. به بیان ساده‌تر، تفسیر RMSE به اطلاعات مضاعفی درباره متغیر هدف نیاز دارد. گاهی اوقات ممکن است نتوان خطای RMSE مربوط به چند دیتاست یا واحد اندازه‌گیری مختلف را با یک‌دیگر مقایسه کرد. در مقابل و به خاطر استاندارد بودن، مقایسه معیار R-squared حاصل از مسائل یا حتی متغیرهای مختلف راحت بوده و نسبت به مقیاس مقاوم است.

آمار و احتمالات پایه و اساس بسیاری از الگوریتم‌های یادگیری ماشین است. تسلط بر این مفاهیم به شما امکان می‌دهد تا درک عمیق‌تری از اصول زیربنایی یادگیری ماشین داشته باشید. این دانش نه تنها باعث فهم بهتر الگوریتم‌ها می‌شود، بلکه توانایی شما را در تحلیل داده‌ها، تفسیر نتایج و بهینه‌سازی مدل‌ها افزایش می‌دهد. از توزیع‌های احتمال گرفته تا آزمون‌های آماری، هر یک از این مفاهیم، نقش حیاتی در طراحی و ارزیابی مدل‌های یادگیری ماشین ایفا می‌کنند. اگر قصد تقویت دانش آماری خود را دارید، می‌توانید با مراجعه به لینک زیر از مجموعه فیلم‌های آموزش آمار و احتمالات فرادرس که از سطح مقدماتی تا پیشرفته را پوشش می‌دهد بهره‌مند شوید:

جمع‌بندی

خطای جذر میانگین مربعات، نقش معیاری ارزشمند را برای اندازه‌گیری دقت پیش‌بینی مدل داشته و باعث می‌شود درک مناسبی از خطا و فاصله میان مقادیر حقیقی و پیش‌بینی شده به‌دست آوریم. در این مطلب از مجله فرادرس آموختیم خطای جذر میانگین مربعات چیست، چگونه محاسبه می‌شود و نگاهی نیز به نقاط قوت و ضعف این معیار ارزیابی داشتیم. معیاری که به دلیل سادگی و قابل فهم بودن، در حوزه‌های متنوعی برای سنجش کیفیت مدل‌های یادگیری ماشین کاربرد دارد.

بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
Statistics by Jim
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *