الگوریتم فازی C–Means در پایتون – راهنمای کاربردی

۲۴۳۹

۱۴۰۲/۰۴/۱۳

۷ دقیقه

PDF

آموزش متنی جامع

امکان دانلود نسخه PDF

از اصول «منطق فازی» (Fuzzy Logic)، می‌توان برای خوشه‌بندی داده‌های چندبُعدی استفاده کرد. با استفاده از منطق فازی در داده‌کاوی، به هر نمونه داده یک «عضویت» (Membership) برای هر «مرکز خوشه» (Cluster Center) تخصیص داده می‌شود که مقداری بین ۰ الی ۱۰۰ درصد دارد. این روش می‌تواند نسبت به خوشه‌بندی‌های دارای «آستانه سخت» (Hard-Thresholded) سنتی که در آن هر نمونه یک برچسب مشخص دارد بسیار قدرتمندتر واقع شود. خوشه‌بندی با الگوریتم فازی C-Means که به آن فازی K-Means نیز گفته می‌شود، در پایتون با بهره‌گیری از تابع skfuzzy.cmeans انجام می‌شود. خروجی این تابع می‌تواند برای دسته‌بندی داده‌های جدید، مطابق با خوشه‌های محاسبه شده (که به آن‌ها پیش‌بینی نیز گفته می‌شود)، با بهره‌گیری از skfuzzy.cmeans_predict هدف‌گذاری مجدد شود و در واقع قابل استفاده برای داده‌های جدید باشد.

فهرست مطالب این نوشته

تولید داده و راه‌اندازی

الگوریتم فازی C-Means برای خوشه‌بندی

ضریب تقسیم فازی (FPC)

دسته‌بندی داده‌های جدید

ساخت مدل

پیش‌بینی

تولید داده و راه‌اندازی

در این مثال، ابتدا ورودی‌های لازم دریافت و سپس، «داده‌های آزمون» (Test Data) برای کار تعریف می‌شوند.

خوشه‌بندی F-Cmeans

الگوریتم فازی C-Means برای خوشه‌بندی

در بالا، داده‌های تست مشاهده می‌شوند. به طور مشخص، سه ناحیه متمایز از هم وجود دارند. اما، اگر مشخص نباشد که چه تعداد خوشه باید وجود داشته باشد چه اقدامی باید انجام داد؟ اگر داده‌ها خیلی شفاف خوشه‌بندی نشوند (مرزهای دسته‌ها مشخص نباشد) چه کار باید کرد؟

فیلم آموزش کاهش تعداد رنگ تصاویر با استفاده از روش های خوشه بندی هوشمند در فرادرس

کلیک کنید

در ادامه، خوشه‌بندی چندین بار با تعداد خوشه‌های بین ۲ و ۹ تکرار می‌شود.

خوشه‌بندی فازی C-Means

ضریب تقسیم فازی (FPC)

«ضریب تقسیم فازی» (Fuzzy Partition Coefficient)، در طیفی بین 0 و ۱ قرار می‌گیرد که در آن ۱ بهترین است. این سنجه به کاربر می‌گوید که داده‌ها به وسیله یک مدل چقدر شفاف توصیف شده‌اند. سپس، مجموعه داده‌ها چندین بار با تعداد خوشه‌های بین ۲ تا ۹ خوشه‌بندی می‌شوند (در اینجا این آگاهی از پیش وجود داشت که تعداد خوشه‌ها سه تا است). سپس، نتایج خوشه‌بندی نمایش داده می‌شود و نمودار ضریب تقسیم فازی رسم می‌شود.

فیلم آموزش خوشه بندی سلسله مراتبی در آر R + گواهینامه در فرادرس

کلیک کنید

هنگامی که مقدار FPC بیشینه شد، داده‌ها به بهترین شکل توصیف می‌شوند.

Fuzzy-Cmeans

همانطور که مشهود است، تعداد ایده‌آل مرکزها برابر با ۳ است. در این مثال کشف این موضوع خبر جدیدی نبود چون همانطور که پیش‌تر بیان شد، از قبل این آگاهی وجود داشت که تعداد خوشه‌ها سه تا است. اما در حالت کلی، استفاده از FPC هنگامی که ساختار داده‌ها شفاف نیست، بسیار مفید محسوب می‌شود. توجه به این نکته لازم است که کار با دو مرکز خوشه آغاز می‌شود. خوشه‌بندی مجموعه داده با تنها یک مرکز خوشه یک راهکار بدیهی است و بر اساس تعریف FPC == 1 را باز می‌گرداند (در واقع تنها یک خوشه وجود دارد که همه داده‌ها به آن تعلق دارند).

دسته‌بندی داده‌های جدید

اکنون که می‌توان داده‌ها را خوشه‌بندی کرد، گام بعدی معمولا برازش نمونه داده‌های جدید در مدل موجود است. به این کار پیش‌بینی گفته می‌شود و به مدل موجود و داده‌های جدید برای دسته‌بندی نیاز دارد. برای دسته‌بندی داده‌های جدید، نیاز به مدل موجود و داده‌های جدید برای انجام دسته‌بندی است.

فیلم آموزش اصول و روش های متن کاوی Text Mining در فرادرس

کلیک کنید

ساخت مدل

همانطور که پیش‌تر بیان شد، بهترین مدل دارای سه خوشه خروجی است. در ادامه، مدل سه خوشه‌ای برای استفاده به منظور انجام خوشه‌بندی مجددا ساخته می‌شود، داده‌های یونیفرم جدید تولید می‌شوند و پیش‌بینی می‌شود که هر نمونه داده جدید به کدام خوشه تعلق دارد.

خوشه‌بندی فازی

پیش‌بینی

در نهایت، داده‌هایی که به صورت یکنواخت نمونه‌برداری شده‌اند تولید می‌شوند و خوشه‌بندی آن‌ها با بهره‌گیری از cmeans_predict انجام می‌شود. cmeans_predict در واقع آن را در یک مدل از پیش موجود ترکیب می‌کند.

خوشه‌بندی فازی C-Means

کد کامل این کار را می‌توان از زیر کپی و در فایل با فرمت py. ذخیره‌سازی کرد.

اگر نوشته بالا برای شما مفید بوده، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

محصول، خدمات یا برند خود را در مجله فرادرس معرفی کنید.

کلیک کنید

بر اساس رای ۱۲ نفر

آیا این مطلب برای شما مفید بود؟

اگر پرسشی درباره این مطلب دارید، آن را با ما مطرح کنید.

ثبت نظر

منابع:

pythonhosted

الهام حصارکی (+)

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

مطالب مرتبط

هوش مصنوعی ادیت عکس رایگان – معرفی ۲۴ سایت و برنامه کاربردی

پرامپت چت جی پی تی برای عکس پروفایل – Prompt پروفایل کاری و شخصی

n8n چیست و چگونه از آن استفاده کنیم؟ – به زبان ساده

برنامه ریزی درسی با هوش مصنوعی رایگان – معرفی ۱۵ ابزار و سایت کاربردی

برنامه ریزی روزانه با هوش مصنوعی – معرفی ۱۵ سایت و ابزار کاربردی

صحبت با هوش مصنوعی گوگل – راهنمای چت صوتی و متنی با Gemini

مزایای ChatGPT Plus چیست؟ – کاربردها و قابلیت های چت جی پی تی پلاس

نصب ChatGPT – راهنمای گام به گام برای ویندوز، موبایل و مک

هوش مصنوعی برای نوشتن تحقیق – ۲۱ سایت و ابزار کاربردی در ۲۰۲۵

۳۱ ابزار و سایت برای بهبود کیفیت عکس با هوش مصنوعی

۲ دیدگاه برای «الگوریتم فازی C–Means در پایتون – راهنمای کاربردی»

فاطمه

۰۱ مهر، در ۱۴۰۳ ۱۲:۵۱ ب.ظ

سلام وقت بخیر
من یک سری داده گرد و غبار دارم که می خواهم با خوشه بندی فازی خوشه بندی انجام دهم ولی مشکل در کد نویسی دارم
لطفا مرا راهنمایی بفرمایید. باتشکر

پاسخ

پوریا نوید

۰۲ مهر، در ۱۴۰۳ ۹:۵۶ ق.ظ

‌
‌با سلام و احترام؛
‌
قسمتی از دوره آموزشی زیر به «خوشه‌ بندی فازی و طراحی سیستم فازی مبتنی بر خوشه‌ بندی» اختصاص پیدا کرده است که ممکن است در این مورد برای شما مفید باشد.