یادگیری ماشین چیست؟ – به زبان ساده

فیلم آموزش یادگیری ماشین Machine Learning با پایتون Python در فرادرس

روش‌های یادگیری ماشین در حوزه رو به رشد علم داده استفاده و کاربرد بسیاری دارند. الگوریتم‌های یادگیری ماشین با استفاده از روش‌های آماری، برای طبقه‌بندی یا پیش‌بینی و کشف بینش‌های کلیدی در پروژه‌های «داده کاوی» (Data Mining) آموزش داده می‌شوند. به طور خلاصه، داده کاوی شامل یادگیری ماشین به همراه بانک اطلاعاتی است. بینش‌های کسب شده، متعاقباً تصمیم‌گیری را در برنامه‌ها و کسب‌وکارها هدایت می‌کنند و به طور ایده‌آل بر معیارهای رشد سازمان‌ها تأثیر می‌گذارند. با ادامه گسترش و رشد داده‌های بزرگ، تقاضای بازار برای دانشمندان داده و مهندسان یادگیری ماشین به میزان زیادی افزایش یافته است؛ از این متخصصان خواسته می‌شود تا به شناسایی مرتبط‌ترین چالش‌ها و مسائل تجاری پرداخته و نسبت به حل آن‌ها با استفاده از روش‌های یادگیری ماشین اقدام کنند.

الگوریتم‌های یادگیری ماشین معمولاً با استفاده از چارچوب‌هایی ایجاد می‌شوند که توسعه راه‌حل مسائل را تسریع می‌کنند. تفاوت بین ML (مخفف Machine Learning) و AI (مخفف Artificial Intelligence) اغلب به اشتباه درک می‌شود؛ در این خصوص باید گفت، در یادگیری ماشین، آموزش بر اساس مشاهدات گذشته انجام و پیش‌بینی مطلوب حاصل می‌شود، در حالی که هوش مصنوعی دلالت بر «عامل» دارد؛ این عامل هوشمند با محیط در تعامل است و در نتیجه از محیط یاد می‌گیرد و اقداماتی را انجام می‌دهد. اقدامات انجام شده توسط عامل هوشمند باید احتمال موفقیت‌آمیز بودن رسیدن به اهداف را به حداکثر برسانند.

یادگیری ماشین چیست

الگوریتم‌های یادگیری ماشین بر اساس «داده‌های آموزشی» (Training Data) مدل‌سازی را انجام می‌دهند، به‌ طوری‌ که امکان پیش‌بینی‌ یا تصمیم‌گیری‌ بدون برنامه‌‌نویسی صریح ممکن شود. روش‌ها و محاسبات آماری نقش بسیار مهمی در یادگیری ماشین دارند و با استفاده از این روش‌ها مثلاً می‌توان به کمک کامپیوتر پیش‌بینی انجام داد؛ البته یادگیری ماشین تنها به استفاده از روش‌های آماری محدود نمی‌شود. بخش دیگری از یادگیری ماشین بر مطالعه «بهینه‌سازی ریاضیاتی» (Mathematical Optimization) متمرکز است و روش‌ها، نظریات و حوزه‌های کاربردی در این زمینه را مورد بحث قرار می‌دهد.

چه اقداماتی باید پیش از شروع عملیات یادگیری ماشین انجام شود؟

در یادگیری ماشین برای آموزش مدل، از داده‌ها استفاده می‌شود. بنابراین قبل از به‌کارگیری یادگیری ماشین بایستی عملیات زیر انجام گیرد.

داده‌ها جمع‌آوری شوند: در مرحله نخست، داده‌ها شامل اعداد، عکس و متن مثل تراکنش‌های بانکی، تصاویر افراد، اقلام خرید، داده‌های سری زمانی، گزارش‌های فروش و غیره از منابع مختلفی جمع‌آوری می‌شود. هر چقدر حجم داده‌های جمع‌آوری شده بیشتر باشد، امکان آموزش بهتر برای مدل فراهم خواهد شد.
داده‌ها پیش پردازش و پاک‌سازی شوند: داده‌های جمع‌آوری شده احتمالا برای ورود به الگوریتم‌های یادگیری ماشین مناسب نیستند، چرا که این داده‌ها حاوی نویز و یا فاقد مقدار هستند (که اصطلاحا به آن داده‌های گم شده یا Missing Values گفته می‌شود). داده‌ها در این مرحله با روش‌های از پیش‌تعریف شده‌ای، پاک‌سازی می‌شوند به‌طوری که بتوان آن‌ها را به عنوان داده‌های آموزشی وارد الگوریتم‌های یادگیری ماشین کرد.

فیلم آموزش یادگیری ماشین و پیاده سازی در پایتون Python – بخش یکم در فرادرس

نحوه پیاده سازی الگوریتم های یادگیری ماشین چگونه است؟

پس از پیش پردازش داده‌ها، برنامه‌نویسان یک مدل یادگیری ماشین را انتخاب و داده‌ها را وارد مدل انتخاب شده می‌کنند، به‌ طوری که مدل خود را برای یافتن الگوها یا پیش‌بینی آموزش دهد. با گذشت زمان، فرد برنامه‌نویس می‌تواند مدل را اصلاح کند. مثلا با تغییر پارامترهای آن، مدل را به سمت نتایج دقیق‌تر سوق دهد. برخی از داده‌ها از مجموعه داده‌های آموزشی جداسازی می‌شوند تا به عنوان داده‌های ارزیابی برای آزمایش دقت عملکرد مدل مورد استفاده قرار بگیرند.

در مرحله تست یا همان ارزیابی، میزان دقت خروجی مدل یادگیری ماشین با دریافت ورودی‌های جدید بررسی می‌شود. نتیجه مدلی است که می‌تواند در آینده با مجموعه‌ داده‌های مختلف مورد استفاده قرار گیرد. عملکرد یک سیستم یادگیری ماشین می‌تواند توصیفی، مبتنی بر پیش‌بینی یا تجویزی باشد.

توصیفی، به این معنی که سیستم برای توضیح آنچه اتفاق افتاده است، از داده‌ها استفاده می‌کند.
مبتنی بر پیش‌بینی، به این معنی که سیستم برای پیش‌بینی آنچه اتفاق خواهد افتاد، از داده‌ها استفاده می‌کند.
تجویزی، به این معنی است که سیستم برای ارائه پیشنهاداتی در مورد اقداماتی که باید انجام گیرد، از داده‌ها استفاده می‌کند.

فیلم آموزش یادگیری ماشین و پیاده سازی در پایتون Python – بخش دوم در فرادرس

زیربخش های یادگیری ماشین کدامند ؟

یادگیری ماشین در حالت کلی به زیربخش‌های مختلفی تقسیم‌بندی می‌شود اما مهم‌ترین رویکردها در یادگیری ماشین، شامل موارد زیر می‌شوند:

در ادامه به معرفی و شرح هر کدام از این موارد در زیربخش‌هایی جداگانه پرداخته شده است.

یادگیری با نظارت در یادگیری ماشین چیست ؟

در این روش مدل‌ها با مجموعه داده‌های برچسب‌گذاری شده آموزش داده می‌شوند و در طول زمان یاد خواهند گرفت و توسعه خواهند یافت. به عنوان مثال، یک الگوریتم با تصاویر سگ‌ها و تصاویر چیزهای دیگر، که همه این تصاویر توسط انسان برچسب‌گذاری شده‌اند، آموزش داده می‌شود و در نتیجه قادر به بازشناسی و تشخیص تصویر سگ جدید خواهد بود و می‌تواند آن را از دیگر تصاویر متمایز سازد.

امروزه یادگیری ماشین با نظارت رایج‌ترین روش مورد استفاده در یادگیری ماشین است. یادگیری با نظارت خود به زیربخش‌هایی تقسیم‌بندی می‌شود که در ادامه به مهم‌ترین آن‌ها اشاره شده است.

«دسته‌بندی» (Classification) که مهم‌ترین کاربردهای آن شامل «شناسایی هویت جعلی» (Fake Identity Recognition)، «دسته‌بندی تصاویر» (Image Classification)، «حفظ مشتریان» (Customer Retention)، «تشخیص‌های پزشکی» (Medical Diagnoses) و غیره است
«رگرسیون» (Regression) که از کاربردهای مهم آن می‌توان به پیش‌بینی رشد جمعیت، پیش‌بینی بازار، پیش‌بینی وضعیت هوا و غیره اشاره کرد.

فیلم آموزش پیاده سازی بازی مار در پایتون با یادگیری تقویتی عمیق در فرادرس

یادگیری بدون نظارت در یادگیری ماشین چیست ؟

این الگوریتم‌ها به دنبال الگوهای موجود در داده‌های بدون برچسب هستند. یادگیری ماشین بدون نظارت می‌تواند الگوها یا روندهای پنهان را پیدا کنند. برای مثال، یک برنامه یادگیری ماشینی بدون نظارت می‌تواند داده‌های فروش آنلاین را بررسی کند و انواع مختلفی از مشتریان خریدار را شناسایی کند. یادگیری بدون نظارت خود به زیربخش‌هایی تقسیم‌بندی می‌شود که در ادامه به مهم‌ترین آن‌ها اشاره شده است.

«خوشه‌بندی» (Clustering) که کاربردهای مهم آن در «سیستم‌های توصیه‌گر» (Recommender Systems)، «بازاریابی هدف‌مند» (Targeted Marketing)، «بخش‌بندی مشتریان» (Customer Segmentation) و غیره است.
«کاهش ابعاد» (Dimensionality Reduction) که کاربردهای مهم آن در «مصورسازی داده‌های حجیم» (Big Data Visualization)، «فشرده‌سازی معنادار» (Significant Compression)، «کشف ساختار» (Structure Discovery)، «کاهش ویژگی» (Feature Reduction) و دیگر موارد است.

یادگیری نیمه نظارتی در ماشین لرنینگ چیست ؟

این الگو بین یادگیری بدون نظارت (بدون هیچ گونه داده آموزشی برچسب گذاری شده) و یادگیری نظارت شده (با داده‌های آموزشی کاملاً برچسب گذاری شده) قرار دارد. برخی از نمونه‌های آموزشی فاقد برچسب‌های آموزشی هستند، با این حال بسیاری از محققان یادگیری ماشین دریافته‌اند که داده‌های بدون برچسب، زمانی که همراه با تعداد کمی از داده‌های برچسب‌گذاری شده استفاده شوند، بهبود قابل توجهی در دقت یادگیری ایجاد خواهد شد.

یادگیری تقویتی در یادگیری ماشین چیست ؟

در یادگیری تقویتی ماشین‌ها از طریق آزمون و خطا و با ایجاد یک سیستم پاداش آموزش داده می‌شوند تا بهترین اقدام را انجام دهند. الگوریتم با مشخص کردن اینکه ماشین چه زمانی تصمیمات درستی گرفته است به آن کمک می‌کند در طول زمان یاد بگیرد و بهتر است چه اقداماتی را انجام دهد.

فیلم آموزش تقلیل ابعاد در یادگیری ماشین (رایگان) در فرادرس

از یادگیری تقویتی در چه حوزه هایی استفاده می شود؟

یادگیری تقویتی در بسیاری از رشته‌ها و زمینه‌هایی مورد مطالعه قرار می‌گیرد که در ادامه به برخی از آن‌ها اشاره شده است.

«نظریه بازی» (Game Theory)
«نظریه کنترل» (Control Theory)
«تحقیق در عملیات» (Operations Research)
«نظریه اطلاعات» (Information Theory)
«بهینه‌سازی مبتنی بر شبیه‌سازی» (Simulation-based optimization)
«سیستم‌های چند عاملی» (Multi-Agent Systems)
«آمار» (Statistics)
«الگوریتم‌ ژنتیک» (GA | Genetic Algorithms)

در یادگیری ماشین، محیط معمولاً بر اساس «فرایند تصمیم‌گیری مارکوف» (MDP | Markov Decision Process) مشخص یا تعیین می‌شود. بسیاری از الگوریتم‌های یادگیری تقویتی، از روش‌های «برنامه‌ریزی پویا» (Dynamic Programming) استفاده می‌کنند. الگوریتم‌های یادگیری تقویتی فاقد یک مدل ریاضی دقیق MDP هستند و زمانی استفاده می‌شوند که به‌کارگیری مدل‌های دقیق ممکن نباشند. از دیگر کاربردهای الگوریتم‌های یادگیری تقویتی، استفاده آن در وسایل نقلیه خودران و یادگیری بازی در مقابل حریف انسانی است.

در یادگیری ماشین روش‌های دیگری نیز توسعه یافته‌اند که در دسته‌بندی‌های بیان شده جای نمی‌گیرند و همین‌طور روش‌هایی مثل «مدل‌سازی موضوعی» (Topic Modeling) و «فرا یادگیری» (Meta Learning) وجود دارند که همزمان می‌توان آن‌ها را در چندین زیرشاخه از یادگیری ماشینی قرار داد.

معرفی فیلم های آموزش یادگیری ماشین و داده کاوی

مجموعه‌های آموزشی فرادرس، دوره‌های ویدیویی هستند که یک موضوع آموزشی را از سطح مقدماتی تا پیشرفته و با در نظر گرفتن جوانب مختلف نظری و عملیاتی پوشش می‌دهد. یادگیری ماشین و مباحث وابسته به آن امروزه چه در پژوهش و چه در صنعت از مباحث پویا و مورد نیاز به حساب می‌آید. دور‌ه‌های آموزش داده کاوی و یادگیری ماشین یکی از این مجموعه‌های آموزشی است که در پلتفرم فرادرس و برای رفع این نیاز منتشر شده است. این مجموعه شامل آموزش سرفصل‌های دانشگاهی و همچنین آموزش برنامه‌نویسی با استفاده زبان‌هایی چون پایتون، متلب، سی‌شارپ و غیره به صورت عملیاتی و کاربردی با هدف آماده‌سازی برای انجام پژوهش و یا ورود به بازار کار است. در تصویر بالا تنها چند نمونه از این آموزش‌ها آورده شده است.

برای شروع یادگیری داده‌ کاوی و یادگیری ماشین و دسترسی به تمام دوره‌های این مجموعه + اینجا کلیک کنید.

روش های مهم و رایج مورد استفاده در یادگیری ماشین

در ادامه برخی دیگر از روش‌ها و رویکردها در یادگیری ماشین را بیشتر مورد بررسی قرار می‌دهیم.

کاهش ابعاد در یادگیری ماشین چیست ؟

«کاهش بعد» (Dimension Reduction) فرآیندی است برای کاهش تعداد متغیرهای تصادفی مورد بررسی که به کمک آن مجموعه‌ای از متغیرهای اصلی به دست می‌آید. روش‌های کاهش ابعاد در حالت کلی عملیات «انتخاب ویژگی» (Feature Selection) یا استخراج ویژگی را پیاده‌سازی می‌کنند. یکی از روش‌های رایج کاهش ابعاد، تحلیل مؤلفه‌های اصلی (Principal Component Analysis | PCA) است.

به طور نظری، PCA یک روش آماری است و کاهش ابعاد را با تبدیل خطی داده‌ها به یک سیستم مختصات جدید انجام می‌دهد. بسیاری از مطالعات از دو مولفه اصلی اول برای ترسیم داده‌ها در دو بعد و شناسایی مصور خوشه‌ها استفاده می‌کنند. تحلیل مولفه‌های اصلی در بسیاری از زمینه‌ها مانند ژنتیک جمعیت، «مطالعات میکروبیوم» (Microbiome Studies) و «علوم جوی» (Atmospheric Science) کاربرد دارد.

فیلم آموزش رویکردهای یادگیری ماشین در R (رایگان)

تشخیص ناهنجاری در یادگیری ماشین چیست ؟

در داده کاوی، «تشخیص ناهنجاری» (Anomaly Detection)، که به عنوان تشخیص «داده پرت» (Outlier Data) نیز شناخته می‌شود، شناسایی موارد، رویدادها یا مشاهداتی از مجموعه داده‌ها است که در الگوهای موجود جای نمی‌گیرند. به طور معمول، موارد ناهنجار نشان دهنده موضوعاتی مانند «کلاهبرداری بانکی» (Bank Fraud)، «نقص ساختاری» (Structural Defect)، «مشکلات پزشکی» (Medical Problems) یا «اشتباهات در یک متن» (Errors in a Text) است. ناهنجاری‌ها به‌عنوان موارد «پرت» (Outliers)، «بدیع» (Novelties)، «نویز» (Noise)، «انحرافات» (Deviations) و «استثنائات» (Exceptions) نیز شناخته می‌شوند.

فیلم آموزش مقدمه ای در رابطه با یادگیری ماشین با پایتون (Python) (رایگان) در فرادرس

در زمینه سوء‌استفاده و «تشخیص نفوذ شبکه» (Network Intrusion Detection)، موارد مورد توجه اغلب کمیاب نیستند، بلکه موارد غیرمنتظره‌ای هستند که فعالیتی غیرعادی و متفاوت از خود نشان می‌دهند. چنین الگویی در تعریف آماری رایج از داده پرت قرار نمی‌گیرد.

بسیاری از روش‌های تشخیص داده پرت (به ویژه، الگوریتم‌های بدون نظارت) در تشخیص داده‌های ناهنجار با شکست مواجه می‌شوند. البته الگوریتم‌های تحلیل خوشه‌ ممکن است بتوانند ریز خوشه‌های تشکیل شده توسط این الگوها را تشخیص دهند.

سه دسته کلی از روش‌های تشخیص ناهنجاری وجود دارد که در ادامه به آن‌ها اشاره شده است.

روش‌های تشخیص ناهنجاری بدون نظارت: ناهنجاری‌ها در مجموعه داده‌های آزمایشی بدون برچسب با این فرض شناسایی می‌شوند که اکثر نمونه‌ داده‌ها نرمال هستند و نمونه‌هایی جستجو می‌شوند که کمترین تناسب را با بقیه مجموعه داده‌ها دارند.
روش‌های تشخیص ناهنجاری نظارت شده: به مجموعه داده‌ای نیاز دارند که به‌صورت «نرمال» و «غیر نرمال» برچسب‌گذاری شده است و شامل آموزش کلاسیفایر است.
روش‌های تشخیص ناهنجاری نیمه نظارت شده: مدلی را می‌سازند که نشان‌دهنده رفتار نرمال از یک مجموعه داده‌های آموزشی نرمال است و سپس احتمال تولید یک نمونه تستی توسط مدل را آزمون می‌کند.

قوانین انجمنی در یادگیری ماشین چیست ؟

یادگیری قوانین انجمنی یک روش یادگیری ماشین مبتنی بر قانون، برای کشف روابط بین متغیرها در پایگاه داده‌های بزرگ است. یادگیری ماشین مبتنی بر قانون، یک اصطلاح کلی برای هر روش یادگیری ماشین است که به‌منظور ذخیره‌سازی، دستکاری یا اعمال دانش، «قوانین» را شناسایی می‌کند، یاد می‌گیرد یا تکامل می‌دهد. مشخصه اصلی یک الگوریتم یادگیری ماشین مبتنی بر قانون، شناسایی و استفاده از مجموعه‌ای از قوانین رابطه‌ای است که دانش کشف شده را نشان می‌دهد.

رویکردهای یادگیری ماشین مبتنی بر قانون شامل سه دسته «سیستم‌های طبقه‌بندی کننده یادگیری» (Learning Classifier Systems)، «یادگیری قوانین انجمنی» (Association Rule learning) و «سیستم‌های ایمنی مصنوعی» (Artificial Immune Systems) می‌شود. قوانین انجمنی، اولین بار، بر اساس مفهوم قوانین قوی، برای کشف نظم بین محصولات در داده‌های تراکنش در مقیاس بزرگ که توسط دستگاه‌های POS در سوپرمارکت‌ها ثبت شده بود، معرفی شد. مثلا قانون {پیاز، سیب‌زمینی}=>{گوشت}، بیان‌کننده این قانون است که اگر مشتری در سبد خرید خود سیب‌زمینی و پیاز را داشته باشد، احتمالا گوشت را نیز خرید خواهد کرد.

تکنیک های رایج مورد استفاده در ماشین لرنینگ

چنین اطلاعاتی می‌تواند به عنوان مبنایی برای تصمیم‌گیری در مورد فعالیت‌های بازاریابی مانند قیمت‌گذاری تبلیغاتی یا جایگاه‌یابی محصول مورد استفاده قرار گیرد. قوانین انجمنی علاوه بر تجزیه و تحلیل سبد بازار، امروزه در زمینه‌هایی مثل «کاوش استفاده از وب» (Web Usage Mining)، تشخیص نفوذ، «تولید پیوسته» (Continuous Production) و بیوانفورماتیک استفاده می‌شود. برخلاف «دنباله‌ کاوی | کاوش الگوهای متوالی» (Sequential Mining)، یادگیری قوانین انجمنی معمولاً ترتیب اقلام را چه در یک تراکنش و چه در بین تراکنش‌ها در نظر نمی‌گیرد.

سیستم‌های طبقه‌بندی‌کننده یادگیری (LCS) خانواده‌ای از الگوریتم‌های یادگیری ماشین مبتنی بر قانون هستند که برای انجام یادگیری نظارت‌شده، یادگیری تقویتی یا یادگیری بدون نظارت، یک مؤلفه اکتشافی، مثلا الگوریتم ژنتیک را با یک مؤلفه یادگیری ترکیب می‌کنند. آنها به دنبال شناسایی مجموعه‌ای از قوانین وابسته به زمینه هستند که به‌منظور پیش‌بینی، دانش را به صورت «تکه‌ای» (Piecewise) ذخیره می‌کنند و به کار می‌برند.

پردازش زبان طبیعی

«پردازش زبان طبیعی» (Natural Language Processing | NLP) زمینه‌ای از یادگیری ماشین است که در آن ماشین‌ها یاد می‌گیرند که زبان طبیعی را همانطور که توسط انسان‌ها صحبت و نوشته می‌شود، درک کنند. داده‌های ورودی در این نوع الگوریتم‌ها نه از نوع داده‌های معمول ساختار یافته بلکه از نوع داده‌های متنی و صوتی وابسته به زبان طبیعی است. پردازش زبان طبیعی به ماشین‌ها اجازه می‌دهد تا زبان را بازشناسی کنند، آن را دریابند، به آن پاسخ دهند، متن جدیدی ایجاد کنند و قادر به ترجمه باشند. پردازش زبان طبیعی فناوری‌های آشنا مانند چت‌بات‌ها و دستیارهای دیجیتالی مانند سیری یا الکسا را امکان‌پذیر می‌سازد.

مدل در یادگیری ماشین چیست ؟

پیاده‌سازی یادگیری ماشین شامل ایجاد مدلی است که از داده‌های آموزشی یاد می‌گیرد، سپس می‌تواند داده‌های جدید را به‌منظور پیش‌بینی پردازش کند. انواع مختلفی از مدل‌ها در سیستم‌های یادگیری ماشین مورد استفاده و تحقیق قرار گرفته‌اند که در ادامه به برخی از مهم‌ترین آن‌ها می‌پردازیم.

فیلم آموزش رگرسیون خطی و شبکه عصبی MLP در پایتون برای پیش بینی چربی بدن (رایگان) در فرادرس

رگرسیون در یادگیری ماشین چیست ؟

رگرسیون روشی برای تعیین رابطه آماری بین یک متغیر وابسته و یک یا چند متغیر مستقل است. تغییرات متغیر مستقل با تغییرات متغیرهای مستقل مرتبط است. تحلیل رگرسیون طیف وسیعی از روش‌های آماری را برای تخمین رابطه بین متغیرهای ورودی و ویژگی‌های مرتبط با آنها در بر می‌گیرد.

رایج‌ترین شکل رگرسیون، رگرسیون خطی است. رگرسیون خطی رابطه خطی بین متغیر وابسته و یک یا چند متغیر مستقل را با استفاده از بهترین خط مستقیم پیدا می‌کند. به طور کلی، یک مدل خطی به سادگی با محاسبه مجموع وزنی ویژگی‌های ورودی، به اضافه ثابتی به نام ترم بایاس که به آن «عرض از مبدا» (Intercept) نیز گفته می‌شود، عمل پیش‌بینی را انجام می‌دهد. در این روش، متغیر وابسته پیوسته، متغیر(های) مستقل می‌تواند پیوسته یا گسسته باشد. از نظر ریاضی، می‌توان معادله رگرسیون خطی را به صورت زیر بیان کرد.

$$y=theta_0+theta_1x_1+theta_2x_2+...+theta_nx_n$$

که در این معادله داریم:

$$y$$ برابر با مقدار پیش‌بینی شده
$$n$$ برابر با تعداد کل ویژگی‌های ورودی
$$x_i$$ برابر با ویژگی ورودی برای مقدار $$i^{th}$$
$$theta_i$$ پارامترهای مدل
$$theta_۰$$ برابر با بایاس
$$theta_1\, theta_2\, … theta_n$$ برابر با ضرایب

هر ضریب نشان دهنده سهم متغیرهای ورودی در تعیین بهترین خط به حساب می‌آید و مانند یک دکمه تنظیم‌گر عمل می‌کند. ضریب با توجه به ویژگی ورودی مربوطه تغییر می‌کند و باعث تغییر در مقدار نهایی می‌شود.

بایاس، انحرافی است که به معادله خط $$y = mx$$ و برای پیش‌بینی‌هایی دقیق‌تر افزوده می‌شود. ما باید بایاس را تنظیم کنیم تا موقعیت خطی که می‌تواند برای داده‌های مفروض مناسب‌تر باشد، بهینه شود.

فیلم آموزش شبکه عصبی پرسپترون + پیاده سازی در متلب در فرادرس

شبکه‌های عصبی مصنوعی در یادگیری ماشین چیست ؟

«شبکه‌‌های عصبی مصنوعی» (Artificial Neural Networks) متشکل از نورون‌های مصنوعی است که به طور مفهومی از نورون‌های بیولوژیکی الهام گرفته شده‌اند. نورون‌ها معمولاً در چندین لایه سازمان‌دهی می‌شوند. نورون‌های یک لایه فقط به نورون‌های لایه‌هایی که بلافاصله قبل و بلافاصله بعد از آن لایه قرار دارد متصل می‌شوند. لایه‌ای که داده‌ها را دریافت می‌کند لایه ورودی و لایه‌ای که نتیجه نهایی را تولید می‌کند لایه خروجی نام دارد. لایه‌های مابین لایه‌های ورودی و خروجی، لایه‌های مخفی نامیده می‌شوند.

یادگیری شامل به‌روزرسانی وزن‌ها در شبکه برای برای بهبود دقت نتیجه است که این عملیات با در نظر گرفتن مشاهدات نمونه همراه است و با به حداقل رساندن خطاهای مشاهده شده انجام می‌شود. یادگیری زمانی همگرا می‌شود که بررسی مشاهدات اضافی به طور مفید، میزان خطا را کاهش نمی‌دهد. حتی پس از یادگیری، نرخ خطا معمولاً به صفر نمی‌رسد. اگر پس از یادگیری، میزان خطا بسیار بالا باشد، معمولاً شبکه باید دوباره طراحی شود.

یادگیری عملاً با تعریف یک تابع هزینه انجام می‌شود که به طور دوره‌ای در طول یادگیری ارزیابی می‌شود و تا زمانی که خروجی آن رو به کاهش باشد، یادگیری ادامه خواهد داشت. هزینه یک آماره است که مقدار آن تقریب زده می‌شود. خروجی‌ها به صورت عددی هستند، بنابراین وقتی خطا کم است، تفاوت بین خروجی و پاسخ صحیح کم خواهد بود. یادگیری تلاش می‌کند تا مجموع تفاوت‌های مشاهدات را کاهش دهد.

فیلم آموزش درخت تصمیم در یادگیری ماشین (رایگان) در فرادرس

ماشین‌های بردار پشتیبان در یادگیری ماشین چیست ؟

«ماشین‌ بردار پشتیبان» (Support Vector Machine) که به عنوان شبکه‌ بردار پشتیبان نیز شناخته می‌شود، مجموعه‌ای از روش‌های یادگیری نظارت شده است که برای طبقه‌بندی و رگرسیون استفاده می‌شوند. یک الگوریتم آموزشی SVM یک طبقه‌بندی‌کننده خطی، باینری و غیر احتمالی است، اگرچه روش‌هایی برای استفاده از SVM در یک تنظیمات طبقه‌بندی احتمالی نیز وجود دارد. علاوه بر انجام طبقه‌بندی خطی، SVMها می‌توانند به طور موثر یک طبقه‌بندی غیرخطی را با استفاده از آنچه که ترفند هسته نامیده می‌شود، انجام دهند، و به طور ضمنی ورودی‌های خود را در فضاهای ویژگی با ابعاد بالا نگاشت می‌کنند.

SVM در مقایسه با الگوریتم‌های جدیدتر مانند شبکه‌های عصبی، دو مزیت اصلی سرعت بالاتر و عملکرد بهتر با تعداد محدود نمونه را دارند. این باعث می‌شود که الگوریتم SVM برای مسائل طبقه‌بندی متن بسیار مناسب باشد، که در آن مجموعه داده‌ای با چند هزار نمونه برچسب گذاری شده معمول است. هدف الگوریتم ماشین بردار پشتیبان یافتن یک «ابر صفحه» (Hyperplane) در یک فضای N بعدی است که به طور جداگانه نقاط داده را طبقه‌بندی می‌کند. نزدیکترین نقاط داده در دو طرف ابر صفحه، بردارهای پشتیبان نامیده می‌شوند. بردارهای پشتیبان بر موقعیت و جهت‌گیری هایپرپلین تأثیر می‌گذارند و بنابراین به ساخت SVM کمک می‌کنند.

ماشین بردا پشتیبان در یادگیری ماشین چیست

مزایای ماشین بردار پشتیبان

هنگامی که یک حاشیه تفکیک قابل توجه بین کلاس‌ها وجود داشته باشد، ماشین بردار پشتیبان یک الگوریتم برتر به حساب می‌آید.
در فضاهای با ابعاد بالا، کارایی بیشتری دارد.
در مواردی که تعداد ابعاد بزرگتر از تعداد نمونه‌ها باشد موثر است.

درخت تصمیم در یادگیری ماشین چیست ؟

«درخت تصمیم» (Decision Tree) یک روش یادگیری ناپارامتریک با نظارت است که برای طبقه‌بندی و برای رگرسیون استفاده می‌شود. هدف ایجاد مدلی است که با یادگیری قوانین تصمیم‌گیری ساده استنتاج شده از ویژگی‌های داده، ارزش متغیر هدف را پیش‌بینی کند. یک درخت را می‌توان به عنوان یک تقریب ثابت «تکه‌ای» (Piecewise) مشاهده کرد. هرچه درخت عمیق‌تر باشد، قوانین تصمیم‌گیری پیچیده‌تر و مدل مناسب‌تر است.

درختی که در آن متغیر هدف می‌تواند مجموعه‌ای از مقادیر گسسته بگیرد، درختان طبقه‌بندی نامیده می‌شوند. در این ساختارهای درختی، برگ‌ها نشان‌دهنده برچسب‌های کلاس هستند و شاخه‌ها نشان‌دهنده ترکیبی از ویژگی‌هایی هستند که به آن برچسب‌های کلاس منتهی می‌شوند. درخت‌های تصمیمی که در آن‌ها متغیر هدف می‌تواند مقادیر پیوسته (اعداد حقیقی) بگیرد، درخت‌های رگرسیون نامیده می‌شوند. در تجزیه و تحلیل تصمیم می‌توان از درخت تصمیم برای نمایش مصور و صریح تصمیمات و تصمیم‌گیری استفاده کرد.

مزایای درخت تصمیم در ماشین لرنینگ

برخی از مزیت‌هایی که این رویکرد یادگیری ماشینی به همراه دارد در زیر فهرست شده است.

درک و تفسیر آن ساده است. درختان را می‌توان مصور ساخت.
نیاز به آماده‌سازی داده‌ها در این روش نسبت به دیگر الگوریتم‌ها کم است. در سایر روش‌ها اغلب نیاز به نرمال‌سازی داده‌ها وجود دارد، متغیرهای ساختگی باید ایجاد شوند و داده‌های فاقد مقدار، حذف شوند.
هزینه استفاده از درخت (برای پیش‌بینی داده‌ها) از نظر تعداد نقاط داده مورد استفاده برای آموزش درخت، لگاریتمی است.
قادر به مدیریت داده‌های عددی و رسته‌ای است.
درخت قادر به حل مسائل با چند خروجی است.
از مدل جعبه سفید استفاده می‌کند. به این معنی که اگر یک موقعیت معین در یک مدل قابل مشاهده باشد، توضیح این شرط به راحتی با منطق بولی توضیح داده می‌شود. در مقابل، در مدل جعبه سیاه، مثل شبکه عصبی مصنوعی، تفسیر نتایج ممکن است دشوارتر باشد.
امکان اعتبارسنجی مدل با استفاده از آزمون‌های آماری وجود دارد. این امر باعث می‌شود که «قابلیت اطمینان» (Reliability) مدل در نظر گرفته شود.
عملکرد خوبی دارد حتی اگر مفروضات آن تا حدی توسط مدل واقعی که داده‌ها از آن تولید شده اند نقض شود.

معایب درخت تصمیم در ماشین لرنینگ

در ادامه به برخی از ضعف‌های درخت تصمیم اشاره شده است.

درخت تصمیم ممکن است مدل‌های بیش از حد پیچیده‌ای ایجاد کنند که مدل داده‌ها را به خوبی تعمیم نمی‌دهند. که به این اتفاق، «بیش برازش» (Overfitting) می‌گویند. مکانیسم‌هایی مانند هرس، تنظیم حداقل تعداد نمونه مورد نیاز در یک گره برگ یا تنظیم حداکثر عمق درخت برای جلوگیری از این مشکل ضروری است.
درخت‌های تصمیم می‌توانند ناپایدار باشند، زیرا تغییرات کوچک در داده‌ها ممکن است منجر به تولید درخت کاملاً متفاوتی شود. این مشکل با استفاده از درخت‌های «جمعی» (Ensemble) کاهش می‌یابد.
در صورت تسلط برخی کلاس‌ها، درخت تصمیم ممکن است دچار اریبی شود. بنابراین توصیه می‌شود قبل از برازش با درخت تصمیم، مجموعه داده را متعادل کنید.

شبکه‌های بیزین در یادگیری ماشین چیست ؟

یک «دسته‌بند نایو بیز» (Naive Bayes Classifier) که به آن «شبکه بیزی» (Bayesian Network) و «شبکه باور» (Belief Network) هم گفته می‌شود، یکی از روش‌های یادگیری ماشین برای حل مسائلی است که دارای عدم قطعیت هستند. شبکه بیزی یک مدل گرافیکی احتمالی است که مجموعه‌ای از متغیرها و وابستگی‌های شرطی آنها را با استفاده از یک گراف غیرمدور جهت‌دار (DAG) نشان می‌دهد. شبکه‌های بیزی احتمالی هستند، زیرا این شبکه‌ها از یک توزیع احتمال ساخته شده‌اند و همچنین از نظریه احتمال برای پیش‌بینی و تشخیص ناهنجاری استفاده می‌کنند.

کاربردهای شبکه بیزین در دنیای واقعی ماهیت احتمالی دارند و در زمینه‌های مختلفی از جمله تشخیص ناهنجاری، تشخیص پزشکی، بینش خودکار، استدلال، پیش‌بینی «سری‌های زمانی» (Time Series) و تصمیم‌گیری در شرایط عدم قطعیت استفاده می‌شوند. شبکه بیزی از دو بخش تشکیل شده است.

گراف غیرمدور جهت‌دار
جدول احتمالات مشروط

گراف شبکه بیزی از گره‌ها و یال‌های جهت‌دار تشکیل شده است که به مفهوم هر یک در زیر اشاره شده است.

گره: مربوط به متغیرهای تصادفی است و این متغیر می‌تواند پیوسته یا گسسته باشد.
یال جهت‌دار: نشان دهنده رابطه علی یا احتمالات شرطی بین متغیرهای تصادفی است و گره‌ها را به هم متصل می‌کند. این پیوندها نشان می‌دهد که یک گره مستقیماً بر گره دیگر تأثیر می‌گذارد و اگر پیوند مستقیم وجود نداشته باشد به این معنی است که گره‌ها از یکدیگر مستقل هستند.

در گراف زیر C ،B ،A و D متغیرهای تصادفی هستند. مطابق با این گراف، گره A والد گره B به حساب می‌آیدو گره C مستقل از گره A است. هر گره در شبکه بیزی دارای توزیع احتمال شرطی (P(Xi | Parent(Xi) است که تأثیر والد را بر آن گره تعیین می‌کند. شبکه بیزی مبتنی بر «توزیع احتمال مشترک» (Joint Probability Distribution) و احتمال شرطی است.

الگوریتم ژنتیک در یادگیری ماشین

در علوم کامپیوتر و تحقیقات در عملیات، الگوریتم ژنتیک (GA) یک الگوریتم فراابتکاری الهام گرفته از فرآیند انتخاب طبیعی است که به کلاس بزرگتر «رایانش تکاملی» (Evolutionary Computation) تعلق دارد. الگوریتم‌های ژنتیک معمولاً برای تولید راه‌حل‌های با کیفیت بالا برای مسائل بهینه‌سازی و جستجو با تکیه بر عملگرهای الهام‌گرفته‌شده از علوم زیست‌شناسی مانند آمیزش، جهش و انتخاب استفاده می‌شوند. برخی از نمونه‌های کاربردهای GA شامل بهینه‌سازی درخت‌های تصمیم برای عملکرد بهتر، حل پازل سودوکو، بهینه‌سازی فراپارامتر و غیره است.

در یک الگوریتم ژنتیک، جمعیتی از راه‌حل‌های کاندید (به نام افراد، موجودات، ارگانیسم‌ها یا فنوتیپ‌ها) برای یک مسئله بهینه‌سازی به سمت راه‌حل‌های بهتر تکامل می‌یابند. هر را‌ه‌حل کاندید دارای مجموعه‌ای از خواص (کروموزوم‌ها یا ژنوتیپ آن‌ها) است که می‌تواند جهش‌یافته و تغییر یابد. به طور سنتی، راه‌حل‌ها به صورت باینری به صورت رشته‌های 0 و 1 نمایش داده می‌شوند، اما رمزگذاری‌های دیگر نیز امکان‌پذیر است.

تکامل معمولاً از جمعیتی از افراد به‌طور تصادفی ایجاد می‌شود و یک فرآیند تکراری است. جمعیت در هر تکرار یک نسل نامیده می‌شود. در هر نسل، «برازش» (Fitness) هر فرد در جمعیت ارزیابی می‌شود. برازش معمولاً برابر با مقدار تابع هدف در مسئله بهینه‌سازی است. افراد با برازش بالاتر به طور تصادفی از جمعیت فعلی انتخاب می‌شوند و ژنوم هر فرد اصلاح می‌شود (بازترکیب می‌شود و احتمالاً به طور تصادفی جهش می‌یابد) تا نسل جدیدی تشکیل شود. سپس نسل جدیدی از راه‌حل‌های کاندید در تکرار بعدی الگوریتم تولید می‌شود. یک الگوریتم ژنتیک معمولی شامل مولفه‌های زیر است.

نمایش ژنتیکی دامنه‌ای از راه‌حل‌ها
تابع برازش برای ارزیابی راه‌حل‌ها

یک نمایش استاندارد از هر راه‌حل کاندید به صورت آرایه‌ای از بیت‌ها است (که مجموعه بیت یا رشته بیت نیز نامیده می‌شود). ویژگی اصلی مجموعه بیت که این نمایش‌های ژنتیکی را ساده می‌سازد این است که قطعات آن‌ها به دلیل اندازه ثابت‌شان به راحتی در یک راستا قرار می‌گیرند و در نتیجه عمل آمیزش را تسهیل می‌کند. الگوریتم ژنتیک، پس از این که نمایش ژنتیکی و تابع برازش تعریف شد، اقدام به مقداردهی اولیه راه‌حل‌ها و سپس بهبود آن از طریق تکرار عملگرهای آمیزش، جهش، وارونگی و انتخاب می‌کند.

مقدمه‌ای بر بهینه‌سازی به کمک الگوریتم‌های فراابتکاری و محاسبات تکاملی

مقداردهی اولیه

اندازه جمعیت به ماهیت مسئله بستگی دارد، اما به طور معمول شامل صدها یا هزاران راه‌حل ممکن است. اغلب، جمعیت اولیه به طور تصادفی ایجاد می‌شود، و طیف وسیعی از راه‌حل‌های ممکن (فضای جستجو) را ممکن می‌سازد. گاهی اوقات، راه‌حل‌ها ممکن است در مناطقی که احتمالاً راه‌حل‌های بهینه یافت می‌شوند، «بذر» شوند.

انتخاب

در طول هر نسل متوالی، بخشی از جمعیت موجود برای پرورش نسل جدید انتخاب می‌شود. راه‌حل‌ها از طریق یک فرآیند مبتنی بر برازش انتخاب می‌شوند و در نتیجه راه‌حل‌های با برازش بالاتر، با احتمال بالاتری انتخاب خواهند شد. روش‌های انتخاب مختلفی وجود دارند که هر راه‌حل را ارزیابی می‌کنند و بهترین راه‌حل‌ها را انتخاب می‌کنند. روش‌های دیگری وجود دارند که فقط یک نمونه تصادفی از جامعه را رتبه‌بندی می‌کنند، زیرا روش‌های اول ممکن است بسیار زمان‌بر باشند.

تابع برازش روی نمایش ژنتیکی تعریف می‌شود و کیفیت راه‌حل ارائه شده را اندازه‌گیری می‌کند. تابع برازش همیشه به مسئله وابسته است. برای مثال، در مسئله کوله پشتی می‌خواهیم ارزش کل اشیایی را که می‌توان در یک کوله‌پشتی با ظرفیت ثابت قرار داد، به حداکثر رساند. نمایش یک راه‌حل ممکن است آرایه‌ای از بیت‌ها باشد، که در آن هر بیت یک شی متفاوت را نشان می‌دهد، و مقدار بیت (0 یا 1) نشان می‌دهد که آیا شی در کوله پشتی قرار گرفته است یا خیر.

هر نمایشی معتبر نیست، زیرا اندازه اشیاء ممکن است از ظرفیت کوله پشتی بیشتر باشد. برازش راه‌حل، مجموع ارزش تمامی اشیاء موجود در کوله پشتی است. در برخی مسائل، تعریف صریح برازش دشوار یا حتی غیرممکن است. در این موارد، ممکن است از شبیه‌سازی برای تعیین مقدار تابع برازش یک «فنوتیپ» (Phenotype) استفاده شود.

حل مساله کوله پشتی (Knapsack Problem) — به زبان ساده

عملگرها در الگوریتم ژنتیک

گام بعدی، تولید نسل دوم با استفاده از راه‌حل‌های انتخاب شده و به کمک عملگرهای ژنتیکی است. عملگرهای ژنتیکی شامل عملیات زیر می‌شود.

«آمیزش» (Crossover)
«جهش» (Mutation)

برای تولید هر راه‌حل جدید، نیاز به یک زوج «والد» داریم که این زوج، خود، در مرحله قبلی انتخاب شده بودند. با تولید یک راه‌حل «فرزند» که با استفاده از روش‌های ترکیب و جهش ایجاد می‌شود. این روند تا زمانی که جمعیت جدیدی از راه‌حل‌ها با اندازه مناسب تولید شود ادامه می‌یابد. اگرچه روش‌های تولیدمثلی که مبتنی بر دو والد است، بیشتر «الهام‌گرفته از زیست‌شناسی» هستند، برخی تحقیقات نشان می‌دهند که بیش از دو «والد» کروموزوم‌های با کیفیت‌تری تولید می‌کنند.

این فرآیندها در نهایت منجر به نسل بعدی کروموزوم‌ها می‌شود که با نسل اولیه متفاوت است. به طور کلی، متوسط برازش با این روش برای جمعیت افزایش می‌یابد، زیرا از نسل اول، بهترین راه‌حل‌ها با احتمال بالا، به همراه نسبت کمی از راه‌حل‌های با برازش کمتر، انتخاب می‌شوند. این راه‌حل‌هایی که برازش کوچک‌تری دارند، تنوع ژنتیکی را در استخر ژنتیکی والدین و بنابراین تنوع ژنتیکی نسل بعدی فرزندان را تضمین می‌کنند.

شرط خاتمه یافتن

فرآیند تولید نسل جدید تا رسیدن به شرایط خاتمه تکرار می‌شود. مهم‌ترین شرایط خاتمه در ادامه فهرست شده است.

راه‌حلی به دست می‌آید که حداقل معیارها را برآورده می‌سازد.
تکرار به تعداد معینی از نسل‌ها رسیده باشد.
هزینه، شامل زمان محاسبه یا بودجه تخصیص یافته، به آستانه تعریف شده‌ای رسیده باشد.
برازش راه‌حل با بالاترین رتبه، به حدی رسیده است که تکرارهای متوالی، دیگر نتایج بهتری ایجاد نمی‌کند.
ترکیبی از موارد فوق.

مقدمه‌ای بر الگوریتم ژنتیک به همراه کد جاوا — به زبان ساده

فیلم آموزش مبانی یادگیری عمیق یا Deep Learning در فرادرس

یادگیری عمیق چیست ؟

در یادگیری عمیق، یک مدل کامپیوتری یاد می‌گیرد که وظایف طبقه‌بندی را مستقیماً از روی تصاویر، متن یا صدا انجام دهد. مدل‌های یادگیری عمیق می‌توانند به دقت پیشرفته‌ای دست یابند، که گاهی اوقات از عملکرد سطح انسانی فراتر است. یادگیری عمیق با استفاده از مجموعه بزرگی از داده‌های برچسب‌گذاری شده و معماری‌های شبکه عصبی که حاوی لایه‌های زیادی هستند، آموزش داده می‌شوند. کاربردهای شبکه‌های عمیق از سال ۲۰۲۲ به‌صورت قابل‌توجهی فراگیر شده است.

آموزش مدل در یادگیری ماشین

به طور معمول، آموزش مدل به تعداد زیادی داده قابل اعتماد نیاز دارند تا مدل‌ها پیش‌بینی‌های دقیقی را انجام دهند. هنگام آموزش یک مدل یادگیری ماشین، مهندسان یادگیری ماشین باید نمونه بزرگ و معرف داده را هدف قرار داده و جمع‌آوری کنند. داده‌های مجموعه آموزشی می‌تواند شامل داده‌های متنی، تصویری، داده‌های جمع‌آوری‌شده از حسگرها یا از تک تک کاربران یک سرویس باشد. مدل‌های آموزش‌دیده که از داده‌های «اریب» (Biased) یا ارزیابی‌نشده به دست می‌آیند، می‌توانند منجر به پیش‌بینی‌های «منحرف» (Skewed) یا نامطلوب شوند. سوگیری الگوریتمی یک نتیجه بالقوه از آماده نبودن کامل داده‌ها برای آموزش است. اخلاق یادگیری ماشین در حال تبدیل شدن به یک زمینه مطالعه و یک بخش ضروری به ویژه در تیم‌های مهندسی یادگیری ماشین است. بیش برازش چیزی است که هنگام آموزش یک مدل یادگیری ماشین باید مراقب آن بود. بیش برازش به این معنی است که دقت یادگیری در داده‌های آموزشی بیش از حد بالا باشد. این دقت بالا ممکن است منجر به مدل‌های پیچیده‌ای شود که در پیش‌بینی و در داده‌های تست به خوبی عمل نمی‌کنند و دچار خطا می‌شوند.

برآوردگر اریب و نااریب — به زبان ساده

ارزیابی مدل در یادگیری ماشین چیست ؟

طبقه‌بندی توسط مدل‌های یادگیری ماشین را می‌توان با روش‌های تخمین دقت، مانند روش Holdout، که داده‌ها را به دو مجموعه آموزشی و تست تقسیم می‌کند اعتبارسنجی و عملکرد مدل آموزشی را ارزیابی کرد. در این روش معمولاً دو سوم داده‌ها به مجموعه آموزشی و یک سوم آن‌ها به مجموعه تست تخصیص داده می‌شوند. در مجموعه تست، روش اعتبارسنجی K-fold به این صورت است که داده‌ها به طور تصادفی به k زیر مجموعه‌ تقسیم می‌شوند. سپس k-1 زیرمجموعه از k زیرمجموعه موجود، به عنوان داده‌های آموزشی و یک زیرمجموعه باقی‌مانده به عنوان داده‌های تست در نظر گرفته می‌شود. علاوه بر روش‌های Holdout و اعتبارسنجی متقاطع، می‌توان از «خودگردان‌سازی» (Bootstrap) برای ارزیابی دقت مدل استفاده کرد که n نمونه را با جایگزینی از مجموعه داده نمونه‌برداری می‌کند.

علاوه بر این، محققان اغلب «حساسیت» (Sensitivity) و «ویژگی» (Specificity) را به ترتیب به معنای «نرخ مثبت درست» (True Positive Rate | TPR) و «نرخ منفی درست» (True Negative Rate |TNR) گزارش می‌کنند. به طور مشابه، محققین گاهی اوقات نرخ مثبت اشتباه (False Positive Rate | FPR) و همچنین نرخ منفی اشتباه ( False Positive Rate | FNR) را گزارش می‌کنند. با این حال، این نرخ‌ها نسبت‌هایی هستند که صورت و مخرج خود را آشکار نمی‌کنند. «مشخصه عملیاتی کل» ( Total Operating Characteristic | TOC) یک روش موثر برای بیان توانایی تشخیصی مدل است. TOC صورت و مخرج‌های نرخ‌های ذکر شده قبلی را نشان می‌دهد، بنابراین TOC اطلاعات بیشتری نسبت به «منحنی مشخصه عملکرد» (ROC) و ناحیه مرتبط ROC در زیر منحنی (AUC) ارائه می‌کند.

«ماتریس درهم‌ریختگی» (Confusion Matrix) یک روش اندازه‌گیری عملکرد برای طبقه‌بندی یادگیری ماشینی است. این ماتریس در واقع یک جدول است که به شما کمک می‌کند تا عملکرد مدل طبقه‌بندی را در مجموعه‌ای از داده‌های آزمایشی بدانید.

منحنی ROC و کاربردهای آن — به زبان ساده

فیلم آموزش بینایی کامپیوتر برای ماشین در فرادرس

کاربردهای یادگیری ماشین چیست ؟

دایره کاربردهای یادگیری ماشین به صورت فزاینده و بیش از پیش فراگیر شده است. در ادامه به برخی از مهم‌ترین استفاده‌های یادگیری ماشین اشاره شده است.

سیستم‌های توصیه‌گر

پیشنهادهای توصیه شده توسط موتورهای نتفلیکس، یوتیوب، اطلاعاتی که در فید فیس‌بوک ظاهر می‌شوند ، پیشنهاد توصیه‌ خرید محصول توسط فروشگاه‌های آنلاین و بسیاری موارد دیگر توسط یادگیری ماشین توسعه داده شده‌اند. الگوریتم‌ها سعی می‌کنند ترجیحات ما را بیاموزند. آن‌ها می‌خواهند یاد بگیرند که ما مثلاً در توییتر، چه توییت‌هایی را تمایل داریم ببینیم، در فیس‌بوک، چه تبلیغاتی، چه پست‌هایی یا محتوای لایک‌شده‌ای برای ما جالب توجه خواهد بود.

تحلیل تصویر و تشخیص اشیا

یادگیری ماشین می‌تواند تصاویر را برای کسب اطلاعات مختلف و به منظور شناسایی افراد و تفکیک آنها از یکدیگر تجزیه و تحلیل کند. هدف تشخیص اشیا این است که به ماشین‌ها قدرت بدهد تا موجودیت‌های تعریف شده را در یک تصویر یا ویدیوی زنده شناسایی کنند. تشخیص اشیاء اغلب با سایر روش‌های بینایی کامپیوتر و «بینایی ماشین» (Machine Vision) ترکیب می‌شود تا برنامه‌های قوی‌تری ایجاد کند. موارد استفاده تشخیص اشیاء اغلب اهدافی مانند مکان‌یابی، ردیابی، شمارش اشیا یا تشخیص ناهنجاری‌ها و نقاط «پرت» (Outlier) در یک محیط دارند. داده‌های تشخیص اشیا اطلاعات تجاری ارزشمندی را ارائه می‌دهد که به ذینفعان اجازه می‌دهد به رویدادها به‌ صورت بلادرنگ پاسخ دهند.