ماشین بردار پشتیبان چیست؟ – الگوریتم SVM به زبان ساده

۴۴۶۶

۱۴۰۴/۰۴/۳

۱۲ دقیقه

PDF

آموزش متنی جامع

امکان دانلود نسخه PDF

از میان الگوریتم‌های ماشین لرنینگ، اغلب افراد با رگرسیون، یادگیری این حوزه را شروع می‌کنند. در مقایسه با سایر الگوریتم‌ها، رگرسیون پیچیدگی چندانی نداشته و به سادگی قابل یادگیری است. اما بسیاری از مسائل با رگرسیون قابل حل نیستند و در چنین مواقعی از الگوریتم‌های دیگر مانند «ماشین بردار پشتیبان» (Support Vector Machine | SVM) استفاده می‌شود. الگوریتم SVM از جمله کارآمدترین راهکارهای یادگیری ماشین به‌حساب می‌آید که هم در مسائل خطی و هم غیر خطی کاربرد فراوان دارد. در این مطلب از مجله فرادرس یاد می‌گیریم که ماشین بردار پشتیبان چیست و با جنبه‌های مختلف این الگوریتم همچون کاربردهای آن که از شناسایی سرطان تا زمین‌شناسی متغیر است آشنا می‌شویم.

آنچه در این مطلب می‌آموزید:

با الگوریتم ماشین بردار پشتیبان آشنا می‌شوید.
تفاوت ماشین بردار پشتیبان و رگرسیون لجستیک را یاد می‌گیرید.
انواع مختلف ماشین بردار پشتیبان را می‌شناسید.
نحوه کارکرد ماشین بردار پشتیبان را به‌صورت ساده درک می‌کنید.
مراحل پیاده‌سازی الگوریتم در زبان پایتون را می‌آموزید.
کاربردها و مزایا و معایب ماشین بردار پشتیبان را بررسی می‌کنید.

فهرست مطالب این نوشته

الگوریتم ماشین بردار پشتیبان چیست؟

تفاوت رگرسیون لجستیک با ماشین بردار پشتیبان چیست؟

آموزش ماشین بردار پشتیبان با فرادرس

معرفی انواع ماشین بردار پشتیبان

ماشین بردار پشتیبان چگونه کار می کند؟

مفاهیم رایج در الگوریتم ماشین بردار پشتیبان چیست؟

پیاده سازی ماشین بردار پشتیبان در پایتون

مرحله ۱: بارگذاری کتابخانه‌های مورد نیاز

مرحله ۲: بارگذاری دیتاست بیماری سرطان

مرحله ۳: ساخت و آموزش دسته‌بند SVM

مرحله ۴: رسم فضای ویژگی و مرز تصمیم

کاربرد ماشین بردار پشتیبان چیست؟

مزایا و معایب ماشین بردار پشتیبان

جمع‌بندی

در این مطلب ابتدا یاد می‌گیریم ماشین بردار پشتیبان چیست، چه تفاوتی با رگرسیون لجستیک داشته و از چه انواع مختلفی تشکیل شده است. سپس با نحوه کارکرد و مفاهیم رایج در این الگوریتم آشنا شده و به پیاده‌سازی یک مثال کاربردی می‌پردازیم. در انتها این مطلب از مجله فرادرس، از کاربرد الگوریتم SVM در یادگیری ماشین می‌گوییم و به چند مورد از مزایا و معایب این الگوریتم اشاره می‌کنیم.

الگوریتم ماشین بردار پشتیبان چیست؟

ماشین بردار پشتیبان یا SVM نوعی الگوریتم یادگیری ماشین از نوع نظارت شده است که برای حل مسائل طبقه‌بندی و رگرسیون مورد استفاده قرار می‌گیرد. به‌طور ویژه، الگوریتم SVM در حل مسائل طبقه‌بندی دودویی که داده‌های دیتاست به دو گروه مجزا دسته‌بندی می‌شوند کاربرد دارد. هدف از به‌کارگیری این الگوریتم، پیدا کردن بهترین خط یا به اصطلاح «مرز تصمیمی» است که بتواند نقاط داده گرو‌ه‌ها یا کلاس‌های مختلف را از یک‌دیگر جدا کند. مرزی که هنگام کار با تعداد زیادی از ویژگی‌ها، «ابَر صفحه»‌ (Hyperplane) نامیده می‌شود. هر چه فاصله یا «حاشیه» بیشتری میان ابر صفحه و نزدیک‌ترین نقاط داده از هر کلاس وجود داشته باشد، یعنی دسته‌بندی بهتری توسط الگوریتم SVM صورت گرفته است.

فیلم آموزش پیاده سازی ربات معامله گر با مدل SVM در پایتون در فرادرس

کلیک کنید

همچنین الگوریتم SVM در یادگیری ماشین و هنگام تحلیل داده‌های پیچیده، زمانی که نتوان داده‌ها را با یک خط راست ساده از یک‌دیگر جدا کرد نیز مفید واقع می‌شود. به این گروه از الگوریتم ماشین بردار پشتیبان، SVM غیر خطی گفته می‌شود که از نوعی تکنیک ریاضیاتی برای نگاشت داده‌ها به فضایی با ابعاد بالاتر و پیدا کردن مرز تصمیم کمک می‌گیرد.

تفاوت رگرسیون لجستیک با ماشین بردار پشتیبان چیست؟

بسته به تعداد ویژگی‌های موجود در دیتاست، می‌توانید یکی از دو الگوریتم رگرسیون لجستیک یا SVM را برای مسئله خود انتخاب کنید. کارایی الگوریتم ماشین بردار پشتیبان زمانی به حداکثر می‌رسد که دیتاست کوچک و پیچیده باشد. رایج است که ابتدا رگرسیون لجستیک را مورد آزمایش قرار می‌دهند و اگر نتایج، دقت لازم و کافی را نداشت، به سراغ SVM می‌روند. رگرسیون لجستیک و SVM در یادگیری ماشین عملکرد مشابهی دارند اما نسبت به ویژگی‌های دیتاست، ممکن است یکی دقت بالاتری داشته باشد. در مطلب زیر از مجله فرادرس، به‌طور کامل درباره الگوریتم رگرسیون لجستیک توضیح داده‌ایم:

مطلب پیشنهادی:

رگرسیون لجستیک (Logistic Regression) — مفاهیم، کاربردها و محاسبات در SPSS

شروع مطالعه

آموزش ماشین بردار پشتیبان با فرادرس

مجموعه فیلم های آموزش یادگیری ماشین مرتبط با فرادرس — برای دسترسی به مجموعه فیلم‌های آموزش داده کاوی و یادگیری ماشین، روی تصویر کلیک کنید.

یادگیری نظارت شده یکی از مهم‌ترین شاخه‌های یادگیری ماشین است که در آن، الگوریتم‌ها با استفاده از داده‌های برچسب‌دار آموزش می‌بینند. این روش در بسیاری از مسائل جهان حقیقی مانند تشخیص تصویر، پیش‌بینی قیمت‌ها و تشخیص ایمیل‌های اسپم کاربرد دارد. در میان الگوریتم‌های یادگیری نظارت شده، ماشین بردار پشتیبان (SVM) از اهمیت ویژه‌ای برخوردار است. این الگوریتم مهم به دلیل توانایی در طبقه‌بندی داده‌های خطی و غیر خطی، مقاومت در برابر مشکل بیش‌برازش و عملکرد خوب در فضاهایی با ابعاد بالا، بسیار مورد توجه متخصصان یادگیری ماشین قرار دارد. همچنین، رگرسیون لجستیک یکی دیگر از الگوریتم‌های مهم در این حوزه است که برای مسائل طبقه‌بندی دودویی استفاده می‌شود.

اگر علاقه‌مند به یادگیری عمیق‌تر این مفاهیم هستید، مجموعه فرادرس فیلم‌های آموزشی جامع و کاربردی را توسط اساتید مجرب تهیه و تولید کرده است که با مشاهده آن‌ها از طریق بخش زیر، می‌توانید مهارت‌های خود را در زمینه یادگیری ماشین و به خصوص الگوریتم SVM و رگرسیون لجستیک ارتقا دهید:

معرفی انواع ماشین بردار پشتیبان

تا اینجا یاد گرفتیم ماشین بردار پشتیبان چیست و چه تفاوتی با الگوریتم رگرسیون لجستیک دارد. با این حال و بسته به مرز تصمیم، الگوریتم SVM را می‌توان به دو نوع زیر تقسیم کرد:

SVM خطی: الگوریتم SVM از یک مرز تصمیم خطی برای جدا کردن نقاط داده کلاس‌های مختلف از یک‌دیگر استفاده می‌کند. این الگوریتم زمانی کاربرد دارد که داده‌ها به‌طور خطی قابل جداسازی باشند. به بیان ساده‌تر، باید بتوان با تنها یک خط راست در فضای ۲ یا چند بعدی، داده‌ها را در کلاس‌های مجزایی طبقه‌بندی کرد. ابر صفحه‌ای که فاصله میان کلاس‌ها را به حداکثر برساند همان مرز تصمیم است.
SVM غیر خطی: زمانی از نوع غیر خطی الگوریتم SVM استفاده می‌شود که نتوانیم داده‌ها را با یک خط راست به دو کلاس مختلف تقسیم کنیم. در SVM غیر خطی، ابتدا داده‌های ورودی از طریق توابعی با عنوان «توابع کِرنل» (Kernel Functions) به فضایی با ابعاد بالاتر نگاشت شده و سپس به‌طور خطی از هم جدا می‌شوند. برای ایجاد مرز تصمیم غیر خطی در این فضای ویژگی تغییر یافته، از یک SVM خطی استفاده می‌شود.

حالا که می‌دانیم ماشین بردار پشتیبان چیست و چه انواعی دارد، در ادامه با نحوه کارکرد این الگوریتم مهم در یادگیری ماشین آشنا می‌شویم.

ماشین بردار پشتیبان چگونه کار می کند؟

در الگوریتم ماشین بردار پشتیبان و برای تعیین مرز جداسازی، تنها نزدیک‌ترین نقاط داده یا همان «بردارهای پشتیبان» به ابر صفحه اهمیت دارند. اما در رگرسیون لجستیک، برای تعیین دسته‌بند، به تمام نقاط داده نیاز است. یک راه‌حل منطقی، انتخاب ابر صفحه‌ای است که بیشترین جدایی یا حاشیه را میان دو کلاس ایجاد کند.

فیلم مجموعه آموزش داده کاوی و یادگیری ماشین – مقدماتی تا پیشرفته در فرادرس

کلیک کنید

چند ابر صفحه جداکننده داده ها — چند ابر صفحه جداکننده داده‌ها

بنابراین، ابر صفحه‌ای را برمی‌گزینیم که فاصله آن تا نزدیک‌ترین نقاط داده از هر طرف بیشینه باشد. در صورت وجود، چنین ابر صفحه‌ای را «حاشیه سخت» (Hard Margin) می‌نامیم. با این توصیف، در تصویر بالا ابر صفحه L2 انتخاب می‌شود. مثالی را مانند آنچه در تصویر زیر آمده است تصور کنید:

انتخاب ابر صفحه برای دیتاست با نمونه پرت

در اینجا یک دایره آبی در گروه قرمزها قرار گرفته است. در ابتدا شاید دسته‌بندی این دو گروه دشوار به‌نظر برسد، اما الگوریتم SVM در یادگیری ماشین، دایره آبی را نمونه پَرتی از گروه آبی در نظر گرفته و با نادیده گرفتن آن، بهترین ابر صفحه، یعنی مرز تصمیمی که بیشترین فاصله را با هر دو کلاس داشته باشد انتخاب می‌کند. به بیان ساده‌تر، می‌گوییم الگوریتم SVM نسبت به نمونه‌های پرت مقاوم است.

بهینه ترین ابر صفحه — بهینه‌ترین ابر صفحه

در این شرایط نیز مانند زمانی که دیتاست فاقد نمونه پرت است، الگوریتم SVM مرز تصمیم با بیشترین حاشیه را پیدا کرده و هر بار که نمونه‌ای از این حاشیه رد شود، مقدار جریمه‌ای به ابر صفحه اضافه می‌کند. در نتیجه به چنین ابر صفحه‌ای «حاشیه نرم» (Soft Margin) گفته می‌شود. اما گاهی نمی‌توان داده‌ها را به شکل خطی از هم جدا کرد.

فرض کنید دیتاستی مانند آنچه در تصویر بالا مشاهده می‌شود در اختیار داریم. راه‌حل الگوریتم SVM برای حل چنین مسئله‌ای، ساخت یک متغیر جدید با استفاده از یک کرنل است. نقطه‌ای ( $x_i$ ) روی محور افقی انتخاب و متناظر با آن، متغیر دیگری به عنوان تابع فاصله ( $y_i$ ) از مبدا $o$ تعریف می‌کنیم. با رسم مجموعه داده و ابر صفحه، تصویری مانند زیر به‌دست می‌آید:

نگاشت فضای تک بعدی داده ها به دو بعدی جداسازی کلاس ها — نگاشت فضای تک بعدی داده‌ها به دو بعدی جداسازی کلاس‌ها

از تابع غیر خطی $y_i$ به عنوان «کرنل» یاد می‌شود.

مفاهیم رایج در الگوریتم ماشین بردار پشتیبان چیست؟

در بررسی این الگوریتم، اغلب عبارات و مفاهیمی مطرح می‌شوند که ممکن است در آغاز درک مناسبی از آن‌ها نداشته باشید. به همین منظور در فهرست زیر به تعریف چند مورد مهم از این مفاهیم پرداخته‌ایم:

فیلم آموزش مفاهیم آماری در داده کاوی و پیاده سازی آن در پایتون Python در فرادرس

کلیک کنید

بردار نقطه ای که دو کلاس مجزا را نشان می دهد و بیانگر مفاهیم مهم در الگوریتم ماشین بردار پشتیبان است

«ابر صفحه» (Hyperplane): مرز تصمیمی که برای جداسازی نمونه‌های چند کلاس مختلف در فضای ویژگی مورد استفاده قرار می‌گیرد. برای مثال در طبقه‌بندی خطی، ابر صفحه برابر با معادله خطی $wx + b = 0$ است.
«بردارهای پشتیبان» (Support Vectors): نزدیک‌ترین نقاط داده به ابر صفحه را گویند و نقش بسیار مهمی در تعیین حاشیه و ابر صفحه دارند.
«حاشیه» (Margin): فاصله میان بردار پشتیبان و ابر صفحه است. اولویت الگوریتم ماشین بردار پشتیبان، بیشینه‌سازی حاشیه است. حاشیه بیشتر، عملکرد بهتر الگوریتم طبقه‌بندی را نشان می‌دهد.
«کرنل»‌ (Kernel): تابع ریاضیاتی که در الگوریتم SVM و برای نگاشت داده‌های ورودی به فضای ویژگی با ابعاد بالا مورد استفاده قرار می‌گیرد. با این کار، حتی اگر نتوان نقاط داده را به شکل خطی از یک‌دیگر جدا کرد، مرز تصمیم یا ابر صفحه به راحتی پیدا می‌شود. برخی از رایج‌ترین کرنل‌ها عبارت‌اند از: خطی، چند جمله‌ای، «تابع شعاعی پایه» (Radial Basis Function | RBF) و سیگوئید.
«حاشیه سخت»‌ (Hard Margin): ابر صفحه‌ای که تمام نقاط داده را بدون خطا در کلاس‌های مجزا دسته‌بندی می‌کند.
«حاشیه نرم» (Soft Margin): وقتی داده‌ها به‌طور کامل قابل جداسازی نیستند یا دیتاست شامل نمونه‌های پرت است، الگوریتم SVM تکنیک حاشیه نرم را به‌کار می‌گیرد. به این شکل که برای هر کدام از نقاط داده، متغیری در نظر گرفته شده و بسته به مقدار متغیرها، الگوریتم اجازه دارد تا برخی از قواعد و نمونه‌های پرت را نادیده بگیرد. به بیان ساده‌تر، مصالحه‌ای شکل می‌گیرد که یک طرف آن افزایش حاشیه و طرف دیگر کاهش پایبندی به اصول طبقه‌بندی کامل است.

پیاده سازی ماشین بردار پشتیبان در پایتون

برای آنکه بهتر درک کنیم الگوریتم ماشین بردار پشتیبان چیست و چگونه عمل می‌کند، در این بخش از مطلب مجله فرادرس، از زبان برنامه‌نویسی پایتون و دیتاست سرطان کتابخانه Scikit-learn برای تشخیص نوع خوش‌خیم یا بدخیم بیماری استفاده می‌کنیم. بهره‌گیری از داده‌های تاریخی درباره بیماران مبتلا به سرطان، پزشکان را قادر می‌سازد تا میان انواع خوش‌خیم و بدخیم بیماری تمایز قائل شوند. در ادامه این بخش، مراحل پیاده‌سازی الگوریتم SVM را در یادگیری ماشین شرح می‌دهیم. برای آشنایی بیشتر درباره نحوه پیاده‌سازی الگوریتم‌های یادگیری ماشین، می‌توانید فیلم آموزش کتابخانه Scikit-learn فرادرس را از طریق لینک زیر مشاهده کنید:

فیلم آموزش کتابخانه scikit-learn در پایتون – الگوریتم های یادگیری ماشین + گواهینامه در فرادرس

کلیک کنید

مرحله ۱: بارگذاری کتابخانه‌های مورد نیاز

ابتدا کتابخانه‌هایی را که برای اجرای الگوریتم ماشین بردار پشتیبان و همچنین رسم نمودار نیاز داریم بارگذاری می‌کنیم:

مرحله ۲: بارگذاری دیتاست بیماری سرطان

سپس دیتاست بیماری سرطان را در متغیری به نام cancerهمراه با دو متغیر Xو yکه به ترتیب بیانگر ویژگی‌ها (دو ستون اول) و کلاس هدف دیتاست هستند ذخیره می‌کنیم:

مرحله ۳: ساخت و آموزش دسته‌بند SVM

برای ساخت مدل یا دسته‌بند SVM از کلاس SVCهمراه با پارامتر کرنل rbfو در ادامه برای آموزش از متد fit()استفاده می‌شود:

مرحله ۴: رسم فضای ویژگی و مرز تصمیم

در آخر با استفاده از مدل آموزش دیده در مرحله قبل و دو ستون یا ویژگی اول دیتاست یعنی mean radius و mean texture که معرف میانگین شعاع سلول‌های سرطانی و میانگین انحراف معیار مقادیر «سطح خاکستری» (Grayscale) در تصاویر هستند، عملکرد الگوریتم SVM را به تصویر می‌کشیم:

خروجی مانند زیر است:

همان‌طور که در نمودار فوق مشاهده می‌کنید، با وجود ظاهر شدن نمونه‌های پرت در هر دو کلاس، الگوریتم SVM به‌خوبی دو کلاس از نقاط داده را از یک‌دیگر جدا کرده است. حالا که می‌دانیم ماشین بردار پشتیبان چیست و پیاده‌سازی آن به چه شکل است، در ادامه با چند مورد از کاربردهای این الگوریتم کاربردی آشنا می‌شویم.

کاربرد ماشین بردار پشتیبان چیست؟

الگوریتم SVM برای دسته‌بندی داده‌ها به روش‌های یادگیری نظارت شده در یادگیری ماشین متکی است و یادگیری نظارت شده نیز کاربردهای فراوانی در صنایع مختلف دارد. در ادامه، بیشتر با برخی از این کاربردها آشنا می‌شویم.

فیلم آموزش کاربرد یادگیری ماشین در مهندسی عمران با متلب در فرادرس

کلیک کنید

آیکون های مختلف با عبارت SVM در میانه تصویر که نشان دهنده کاربرد های الگوریتم SVM است

۱. مسائل زمین شناسی

به عنوان یکی از کاربردهای الگوریتم ماشین بردار پشتیبان می‌توان به قابلیت آن در پایش ساختار لایه‌ای زمین اشاره کرد. مسائلی این چنین را «وارونگی» (Inversion) می‌نامند که مشاهدات یا نتایج به‌دست آمده، نسبت به متغیرها یا پارامترهای مولد خود وابستگی دارند. در طی این فرایند، تابع خطی و مدل‌های بردار پشتیبان، داده‌های الکترومغناطیسی را از هم جدا می‌کنند. هر چه اندازه مسئله کوچک‌تر باشد، ابعاد کمتری نیز خواهیم داشت.

۲. ارزیابی احتمال روان گرایی

هنگام وقوع رخدادهایی مانند زلزله، مسئله «روان‌گرایی خاک» (Soil liquefaction) بسیار اهمیت پیدا می‌کند. موضوعی که باید هنگام طراحی و ساخت هر نوع زیرساخت عمرانی مورد بررسی قرار گیرد. الگوریتم SVM نقش مهمی در تشخیص احتمال رخداد جنبه‌های مختلف روان‌گرایی ایفا می‌کند. در واقع دو آزمایش «نفوذ استاندارد» (Standard Penetration Test | SPT) و «نفوذ مخروط» (Cone Penetration Test | CPT) را با SVM پیاده‌سازی می‌کنند و از داده‌های محیطی برای پیش‌بینی زمین لرزه استفاده می‌شود.

همچنین الگوریتم SVM در توسعه مدل‌هایی که شامل چند متغیر مانند معیارهای خاک و پارامترهای روان‌گرایی هستند، برای تعیین نیروی سطح زمین کاربرد دارد. دقت ماشین بردار پشتیبان برای چنین مسائلی حدود ۹۶ تا ۹۷ درصد بوده است.

۳. بازشناسی همولوژی از راه دور پروتئین

همولوژی از راه دور پروتئین زیرشاخه‌ای از زیست‌شناسی محاسباتی است که در آن پروتئین‌ها بر اساس دنباله آمینو اسیدها به پارامترهای ساختاری و کاربردی تقسیم می‌شوند. الگوریتم SVM دنبال‌های پروتئینی مشابه را شناسایی کرده و نقش مهمی در همولوژی از راه دور و در نتیجه زیست‌شناسی محاسباتی ایفا می‌کند.

۴. دسته بندی داده

الگوریتم ماشین بردار پشتیبان یا SVM در یادگیری ماشین را به عنوان راه‌حلی برای مسائل پیچیده ریاضی می‌شناسند. به‌طور خاص نوعی از SVM برای «دسته‌بندی داده» ایده‌آل است که از تعداد نمونه‌های پرت کاسته و الگوها را شناسایی کند.

۵. تشخیص چهره و طبقه بندی احساسات

الگوریتم SVM در محتوای تصویری، ساختار چهره‌ها را تشخیص می‌دهد. مجموعه داده آموزشی از دو کلاس چهره (با برچسب ۱+) و غیر چهره (با برچسب ۱-) و همچنین تصاویری به ابعاد n در n پیکسل، برای تمایز قائل شدن میان تصاویر چهره و غیر چهره استفاده می‌کند. سپس هر پیکسل تجزیه و تحلیل شده و ویژگی‌های مربوط به چهره استخراج می‌شوند. در پایان، بر اساس شدت پیکسل‌ها، مرز تصمیمی در اطراف ساختار چهره ترسیم و دسته‌بندی تصاویر انجام می‌شود. علاوه‌‌بر این، الگوریتم ماشین بردار پشتیبان در دسته‌بندی احساسات چهره نیز کاربرد دارد.

فیلم آموزش پروژه محور پردازش تصویر با OpenCV در C++‎ - تشخیص چهره (رایگان) در فرادرس

کلیک کنید

تصویری با نقاطی روی آن که بیانگر کاربرد تشخیص چهره است

۶. دسته بندی بافت سطح

برای دسته‌بندی تصاویر مربوط به سطوح مختلف از الگوریتم SVM استفاده می‌شود. ماشین بردار پشتیبان بر اساس تصاویر کلیک شده، بافت سطوح موجود را به کلاس‌های متفاوتی مانند صاف و ناهموار تقسیم می‌کند.

۷. طبقه بندی متن و بازشناسی دست خط

طبقه‌بندی متون به معنی تقسیم داده‌ها در کلاس‌های از پیش تعریف شده است. برای مثال، مقالات خبری به چند دسته مختلف همچون سیاست، کسب‌وکار، ورزش و اقتصاد تقسیم می‌شوند. به‌طور مشابه، ایمیل‌ها در دو گروه «عادی» و «اسپم» قرار می‌گیرند. از دیدگاه فنی، به هر مقاله یا محتوای متنی یک امتیاز اختصاص یافته و پس از مقایسه با حد آستانه‌ای مشخص، در گروه یا دسته مربوطه قرار می‌گیرد.

ورودی الگوریتم SVM در مسئله بازشناسی دست‌خط، دیتاستی شامل دست‌نوشته افراد مختلف است. به‌طور معمول، آموزش دسته‌بندهای SVM ابتدا با تعداد کمی از داده‌ها شروع شده و سپس بر اساس امتیازهای به‌دست آمده، فرایند طبقه‌بندی اجرا می‌شود. همچنین از الگوریتم ماشین بردار پشتیبان برای تشخیص متون نگارش شده توسط انسان از کامپیوتر استفاده می‌شود.

۸. بازشناسی گفتار

در مثال‌های مربوط به بازشناسی گفتار، کلمات از متنِ صدا جدا و برای هر کدام ویژگی‌های منحصربه‌فردی استخراج می‌شوند. از جمله تکنیک‌های استخراج ویژگی می‌توان از LPC، MFCC و LPCC نام برد. این تکنیک‌ها، داده‌های صوتی را جمع‌آوری می‌کنند و سپس به عنوان ورودی در اختیار SVM قرار می‌دهند.

فیلم آموزش تشخیص دستور گفتار با هوش مصنوعی در متلب + گواهینامه در فرادرس

کلیک کنید

۹. شناسایی تغییر

با کمک الگوریتم SVM می‌توان هر گونه تغییر و دست‌کاری در تصاویر دیجیتال را شناسایی کرد. به این صورت می‌توان در کاربردهای امنیتی، جایی که ممکن است تصاویر آلوده باشند از الگوریتم ماشین بردار پشتیبان کمک گرفت. اغلب، تراکم پیکسل‌ها در این تصاویر بالا بوده و یافتن پیام‌های مخفی شده دشوار است. اما حتی چنین تصاویری نیز با جداسازی پیکسل‌ها و ذخیره‌سازی داده در دیتاست‌های مجزا برای مدل SVM، قابل بررسی و تحلیل هستند.

۱۰. تشخیص سرطان

برای مدت‌ها متخصصان حوزه پزشکی، پژوهشگران و دانشمندان در سراسر جهان به دنبال یافتن راهی برای تشخیص بیماری سرطان در مراحل اولیه بوده‌اند. امروزه چند نمونه از ابزارهای هوش مصنوعی و یادگیری ماشین برای این منظور معرفی شده‌اند. به عنوان مثال در ژانویه سال ۲۰۲۰، شرکت گوگل ابزار هوشمندی را برای تشخیص سرطان سینه توسعه داد. در این کاربرد، تصاویر سلول‌های سرطانی به عنوان ورودی مدل SVM معرفی شده و پس از تحلیل و آموزش مدل، به دو گروه خوش‌خیم و بدخیم تقسیم می‌شوند.

پزشکی در حال نگاه کردن به اسکن بیمار که نشان دهنده کاربرد تشخیص سرطان است

یادگیری ماشین امروزه به یکی از مهم‌ترین و تأثیرگذارترین حوزه‌های فناوری تبدیل شده است. این شاخه از هوش مصنوعی در طیف گسترده‌ای از صنایع و کاربردها، از پزشکی و مراقبت‌های بهداشتی گرفته تا مالی، خودروسازی و حتی کشاورزی، نقشی حیاتی ایفا می‌کند. الگوریتم SVM تنها یکی از الگوریتم‌های کاربردی در این جهان گسترده است. این الگوریتم به دلیل دقت بالا و توانایی در حل مسائل پیچیده طبقه‌بندی و رگرسیون، در بسیاری از کاربردهای عملی مورد استفاده قرار می‌گیرد. با این حال، برای موفقیت در حوزه یادگیری ماشین، آشنایی با طیف وسیعی از الگوریتم‌ها و تکنیک‌ها ضروری است. آموزش و یادگیری موثر مفاهیم پایه و پیشرفته یادگیری ماشین نه تنها برای پیشرفت فردی، بلکه برای نوآوری و پیشرفت در صنایع مختلف نیز بسیار حائز اهمیت است.

برای کمک به شما در این مسیر یادگیری، وب‌سایت فرادرس مجموعه‌ای جامع از فیلم‌های آموزشی را از سطح مبتدی و مفاهیم اولیه تا مباحث پیشرفته و پروژه محور ارائه می‌دهد که مشاهده آن‌ها را به ترتیب زیر پیشنهاد می‌کنیم:

مزایا و معایب ماشین بردار پشتیبان

تا اینجا یاد گرفتیم ماشین بردار پشتیبان چیست، چگونه پیاده‌سازی می‌شود و چه کاربردهایی دارد. با این حال، استفاده بهینه از الگوریتم‌های یادگیری ماشین مانند SVM نیازمند درک مزایا و معایبی است که با خود به همراه دارند. مزایایی همچون:

کارایی بالا هنگامی که داده‌ها خطی باشند.
عملکرد بهتر در ابعاد بالا.
قابلیت حل مسائل پیچده با بهره‌گیری از توابع کرنل.
مقاوم در برابر نمونه‌های پرت.
کارآمد در دسته‌بندی تصاویر.

همچنین الگوریتم SVM مانند سایر الگوریتم‌ها در یادگیری ماشین معیابی نیز دارد. از جمله:

انتخاب تابع کرنل مناسب دشوار است.
عملکرد ضعیف در مقابل دیتاست‌های بزرگ.
پیچیدگی در تنظیم و به تصویر کشیدن نتایج حاصل از پارامترهای الگوریتم.

جمع‌بندی

در عین کارآمدی، درک و همچنین توسعه الگوریتم SVM پیچیدگی چندانی ندارد و برای پردازش داده‌های خطی و غیر خطی از آن استفاده می‌شود. در این مطلب از مجله فرادرس یاد گرفتیم که ماشین بردار پشتیبان چیست و همراه با معرفی انواع آن، به پیاده‌سازی و شرح کاربردهای این الگوریتم مهم در یادگیری ماشین پرداختیم. سادگی و کارایی بالا این الگوریتم باعث شده تا در طراحی و توسعه بسیاری از سیستم‌های هوشمند امروزی به‌کار گفته شود.

محصول، خدمات یا برند خود را در مجله فرادرس معرفی کنید.

کلیک کنید

بر اساس رای ۳ نفر

آیا این مطلب برای شما مفید بود؟

اگر پرسشی درباره این مطلب دارید، آن را با ما مطرح کنید.

ثبت نظر

منابع:

GeeksforGeeks TechTarget Spiceworks Analytics Vidhya

امیر حسین فقهی (+)

امیر حسین فقهی دانش‌آموخته کارشناسی ارشد مهندسی کامپیوتر است. از علاقه‌مندی‌های او، یادگیری ماشین و برنامه‌نویسی است و مطالب مرتبط با هوش مصنوعی و توسعه نرم‌افزار را در مجله فرادرس نگارش می‌کند.

مطالب مرتبط