«یادگیری ماشین» (Machine Learning | ML) از روشهای «هوش مصنوعی» (Artificial Intelligence | AI) است که به سیستم توانایی یادگیری خودکار و بدون برنامهریزی صریح را میدهد. به عبارت دیگر، هدف در ماشین لرنینگ ساخت ماشینهای هوشمندی است که با استفاده از مجموعهای از دادهها و تجربیات، به یادگیری بپردازند. هدف اصلی ماشین لرنینگ طراحی و توسعه برنامههای هوشمندی است که بتوانند به دادهها دسترسی پیدا کنند و از آنها برای یادگیری استفاده کنند.
فرآیند یادگیری با دادههایی به عنوان ورودی آغاز میشود، تا ماشین با بهرهگیری از آنها به الگوهای پنهان موجود در آن مجموعه داده دست پیدا کند و بر اساس کشف الگوهای پنهان و بینش حاصل شده، تصمیمات بهتری بگیرد. در واقع، هدف اصلی در این علم این است که به ماشین این اجازه داده شود که بدون دخالت و کمک انسان، به طور اتوماتیک یادگیری داشته باشد و بتواند اقدامات خود را مطابق با آن تنظیم کند.
روشهای ماشین لرنینگ
ماشین لرنینگ روشهای گوناگونی دارد که در چهار دسته اصلی «یادگیری نظارت شده» (Supervised Learning | یادگیری با ناظر)، «یادگیری نظارت نشده» (Unsupervised Learning | یادگیری بدون ناظر | یادگیری غیر نظارت شده)، «یادگیری نیمهنظارت شده» (Semi-Supervised Learning) و «یادگیری تقویتی» (Reinforcement Learning) قرار میگیرند. شایان ذکر است که پیرامون وجود دسته یادگیری نیمهنظارت شده، بین پژوهشگران اختلاف نظر وجود دارد. در ادامه به تعریف انواع روشهای یادگیری ماشین پرداخته شده است.
روشهای نظارت شده: در روش یادگیری نظارت شده، ورودی و خروجی الگوریتم از ابتدا مشخص است. در واقع، الگوریتم یادگیری ماشین نظارت شده، شروع به تجزیه و تحلیل روی مجموعه دادههای ورودی (دادههای آموزش | Train Data | Train Set) میکند. در نهایت، الگوریتم یادگیری نظارت شده پس از آموزش دیدن روی مجموعه داده دارای خروجیهای مشخص، یک الگو و یا به بیان بهتر، مدلی را استنباط میکند که دادههای ورودی بر اساس آن به دادههای خروجی مبدل میشوند.
ماشین آموزش دیده قادر خواهد بود با استفاده از مدل استنباط شده، خروجی را برای نمونه دادههای جدید با یک ضریب خطای مشخص، پیشبینی کند. این الگوریتم میتواند خروجی خود را با خروجی صحیح و از قبل تعیین شده مقایسه کند و خطاهای موجود را بیابد تا بر اساس آن مدل را اصلاح کند.
روشهای نظارت نشده: الگوریتمهای یادگیری ماشین نظارت نشده هنگامی استفاده میشوند که در دادههای مورد استفاده جهت آموزش ماشین، ورودی و خروجی سیستم از ابتدا مشخص نباشند. در واقع، در این نوع مسائل یادگیری ماشین، هدف ارتباط ورودی و خروجی نیست؛ بلکه الگوریتم یادگیری ماشین به دنبال تابعی برای توصیف ساختار پنهان و خاص موجود در دادهها است (منظور دادههای ورودی است که خروجی آنها مشخص نیست).
در روشهای یادگیری ماشین نظارت نشده، الگوریتم با بررسی شباهتها و تفاوتهای میان دادهها، به یک الگو برای خوشهبندی کردن دادهها دست پیدا میکند و بر اساس این الگو، میتواند خروجی را برای نمونه دادههای جدید پیشبینی کند.
- برای دیدن فیلم آموزش یادگیری ماشین با پایتون + اینجا کلیک کنید.
روشهای نیمهنظارت شده: الگوریتمهای یادگیری ماشین نیمهنظارت شده، از جمله روشهای یادگیری ماشین هستند که میتوان گفت بین یادگیری باناظر و یادگیری بدون ناظر قرار میگیرند. در یادگیری نیمهنظارتی، از هر دو نوع داده، یعنی دادههایی با خروجی مشخص (برچسبدار | Labeled Data) و دادههایی فاقد خروجی مشخص (فاقد برچسب | Unlabeled Data) برای مرحله آموزش مدل استفاده میشود. به طور معمول در زمان آموزش یک مدل یادگیری نیمهنظارت شده، از مقدار کمی از دادههای دارای برچسب و مقدار زیادی از داده های بدون برچسب بهره برده میشود. سیستمهایی که از این روش استفاده میکنند، به میزان قابل توجهی دقت یادگیری را بهبود میبخشند.
البته، چنانکه پیش از این نیز بیان شد، پیرامون وجود دستهای از روشها با عنوان روشهای یادگیری ماشین نیمهنظارت شده، بین پژوهشگران اختلاف نظر وجود دارد و در واقع، گروهی برای این باور هستند که روشهای نیمهنظارت شده در واقع همان روشهای بدون ناظر هستند.
روشهای یادگیری تقویتی: در یادگیری تقویتی، «عامل هوشمند» (Intelligent Agent) با انجام اقداماتی در محیط و دیدن نتایج آنها، با محیط خود ارتباط برقرار میکند. نتیجه ارتباط عامل با محیط میتواند یک خطا یا یک پاداش باشد. هدف در روشهای یادگیری تقویتی، بیشینه کردن پاداش است. در واقع، عامل در مسیر بیشینه کردن پاداش (امتیاز) اقدام میکند و در غیر این صورت، خطا (مجازات | تنبیه) دریافت میکند. در یادگیری تقویتی، عامل هوشمند برای انجام تصمیمگیریهای متوالی آموزش میبیند یا به بیان دیگر، عامل میآموزد که در یک محیط نامعلوم و پیچیده به هدف یعنی همان بیشینه کردن پاداش برسد.
برای فراگیری روشهای یادگیری ماشین، نیاز به تخصیص زمان و استفاده از آموزشهای کامل، جامع و به زبان ساده است. در بخش بعدی این مطلب، منبع به زبان فارسی و جامع یادگیری ماشین، معرفی شده است.
معرفی فیلم آموزش یادگیری ماشین فرادرس
طول مدت این دوره آموزشی بیست ساعت و پنجاه و نه دقیقه و مدرس آن، دکتر امیرحسین کیهانیپور است. این دوره آموزشی برای علاقهمندان و فعالان حوزه فناوری اطلاعات و ارتباطات، دانشجویان و فعالان حوزههای مهندسی کامپیوتر، علوم کامپیوتر، هوش مصنوعی، «علم داده» (Data Science)، علم اطلاعات و دانششناسی، برنامهنویسها و دیگر علاقهمندان به هوش مصنوعی و علم داده مناسب است. از جمله مباحث مورد بررسی در فیلم آموزش یادگیری ماشین میتوان به کلیات و مفاهیم پایه در یادگیری ماشین، بررسی روشهای کلاسیک یادگیری ماشین، یادگیری تقویتی و دیگر موارد اشاره کرد.
- برای دیدن فیلم آموزش یادگیری ماشین + اینجا کلیک کنید.
جمعبندی
به طور کلی میتوان گفت که ماشین لرنینگ امکان تجزیه و تحلیل مقادیر حجیمی از دادهها را فراهم میکند. امروزه، ماشین لرنینگ در اکثر صنایع و کسب و کارها مورد استفاده قرار میگیرد و تصمیمات بسیار تاثیرگذار دنیای امروز بر اساس پردازشهای انجام شده روی دادهها و نتایج حاصل از آنها اتخاذ میشود. در سالهای اخیر پیشرفتهای چشمگیری در زمینه یادگیری ماشین به وقوع پیوسته است. به طور کلی باید گفت که این علم، چشماندازی جذاب و جالب توجه را در ذهن جهانیان ایجاد کرده است.
اگر این مطلب برای شما مفید بوده است، آموزشها و مطالب زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای دادهکاوی و یادگیری ماشین
- آموزش یادگیری ماشین
- مجموعه آموزشهای هوش مصنوعی
- یادگیری ماشین (Machine Learning) چیست؟ — راهنمای کامل
- معرفی ۱۰ کتاب یادگیری ماشین لرنینگ با پایتون
- آموزش یادگیری ماشین با مثال های کاربردی — مجموعه مقالات جامع وبلاگ فرادرس