پیش بینی رویگردانی مشتریان با یادگیری ماشین – راهنمای کاربردی


در این مطلب، به موضوع پیش بینی رویگردانی مشتریان با یادگیری ماشین پرداخته شده است. پیش از ورود به بحث اصلی، یعنی پیش بینی رویگردانی مشتریان با یادگیری ماشین تعریفی از رویگردانی مشتریان ارائه میشود. در سادهترین تعریف، میتوان گفت که «رویگردانی» (Churn) فرایندی است که طی آن، مشتریان از ادامه همکاری با یک کسب و کار منصرف میشوند و دیگر به تهیه محصولات و خدمات خود از آن سازمان خاص، ادامه نمیدهند. پیشگیری از کاهش سود و یا از دست دادن کامل آن، یکی از انگیزههای اصلی سازمانها برای کاهش رویگردانی مشتریان است.
ولیکن، دلایل گوناگون دیگری نیز برای این موضوع وجود دارد. از جمله مهمترین این موارد میتوان به این موضوع اشاره کرد که هزینه جذب مشتری جدید، به شدت از هزینه حفظ مشتریان کنونی بیشتر است. بنابراین، از نظر مالی، تلاش برای ممانعت از رویگردانی مشتریان، کاری مقرون به صرفهتر محسوب میشود. با وجود آنکه رویگردانی مشتریان یک مسئله مهم برای کسب و کارها است، راهکار پیشگیری از رویگردانی مشتریان همیشه واضح نیست. در بسیاری از موارد، بدون دادههای توصیفی، شرکتها زیانهای زیادی را به دلیل رویگردانی مشتریان متحمل میشوند. خوشبختانه، یادگیری ماشین یک راهکار موثر برای شناسایی عوامل موثر در رویگردانی مشتریان است و ابزارهایی را در این راستا، در اختیار سازمانها قرار میدهد.
گام اول در پیش بینی رویگردانی مشتریان با یادگیری ماشین
همچون بسیاری از دیگر وظایف یادگیری ماشین، اولین و معمولا مهمترین گام برای پیش بینی رویگردانی مشتریان با یادگیری ماشین، گردآوری دادهها است. مجموعه دادههای متداول مورد استفاده برای وظیفه پیشبینی رویگردانی مشتریان، معمولا شامل دادههای مشتریان مانند زمان صرف شده در وبسایت شرکت، لینکهای کلیک شده، محصولات خریداری شده، اطلاعات جمعیتشناسی مشتریان، «تحلیل متن» (Text Analysis) نظرات مشتریان، وضعیت روابط مشتریان با کسب و کار و دیگر موارد میشود. کلیدیترین مسئله در اینجا، کیفیت بالا، قابل اعتماد بودن و زیاد بودن (مناسب بودن) حجم دادهها است.
تعریف مسئله رویگردانی
از نظر برخی از سازمانها، بهترین نوع تعریف مسئله رویگردانی مشتریان، مسئلهای است که در آن، نسبت رویگردانی به حفظ مشتری، پیشبینی شود. برای دیگر سازمانها، پیشبینی درصد خطر امکان رویگردانی یک مشتری، مورد انتظار است. برای بسیاری از دیگر سازمانها، شناسایی رویگردانی ممکن است متشکل از اتخاذ یک چشمانداز سراسری و پیشبینی نرخ رویگردانی مشتریان در آینده باشد
. همه این پرسشها و مسائل، سنجههای صحیحی هستند، اما باید در سلسله مراتب پیش بینی رویگردانی مشتریان با یادگیری ماشین به طور مستمر انتخاب و پاسخدهی شوند.
هنگامی که دادهها گردآوری، آمادهسازی و پاکسازی شدند، میتوان مدلسازی را آغاز کرد. استفاده از مناسبترین مدل یادگیری ماشین برای یک مسئله خاص، بیش از آن که یک کار علمی باشد، یک هنر است. در چنین مسائلی، کارشناس معمولا بیشتر با یک مسئله دستهبندی مواجه است (پیشبینی اینکه یک فرد خاص رویگردانی میکند) که مدلهای گوناگونی برای آن وجود دارند. برای مسائل دستهبندی، مانند آنچه در اینجا بیان شد، «درخت تصمیم» (Decision Tree) و «رگرسیون لجستیک» (Logistic Regression) قابل استفاده هستند. دلیل انتخاب این مدلها، سهولت استفاده از آنها، سرعت آموزش و استنتاج و همچنین، خروجیهای قابل استفاده آنها است. اغلب کارشناسان، از این روشها به عنوان روشهای پایهای و مبنایی استفاده میکنند که صحت مناسبی دارند و پس از آن، به سراغ مدلهای پیچیدهتر میروند.
تعریف سنجهها با دادههای مشتریان
هنگامی که یک مدل انتخاب شد، نیاز به آن دارد که بر اساس بنچمارکهای سازگار و قابل اندازهگیری، مورد ارزیابی قرار بگیرد. یک راه برای انجام این کار، استفاده از «منحنی مشخصه عملکرد سیستم» (Receiver Operating Characteristic | ROC)، پس از اعمال مدل روی مجموعه تست است. چنین نموداری، نرخ «مثبت صحیح» (True Positive) را نسبت به «مثبت غلط» (False Positive) میسنجد. با بیشینه کردن «ناحیه زیر نمودار» (Area Under The Curve)، میتوان کارایی مدل را بیشینه و یا موازنه بین مدلهای مختلف را ارزیابی کرد.
دیگر سنجه مفید، منحنی «دقت و فراخوانی» (Precision-Recall Curve) است که در آن، نمودار «دقت» (Precision) در قیاس با «فراخوانی» (Recall) ترسیم شده است. این منحنی برای مسائلی مفید است که یک کلاس از جهت کیفی، جذابتر از کلاس دیگری است. در مسئله رویگردانی مشتریان، کاربران به دستههای کوچکتری تقسیم میشوند که یکی از این دستهها، مربوط به مشتریانی است که درصدد رویگردانی هستند. دسته دیگر، در واقع دسته مشتریانی است که درصدد رویگردانی از سازمان نیستند. در پیش بینی رویگردانی مشتریان با یادگیری ماشین دسته مربوط به مشتریان در حال رویگردانی، برای کارشناس از اهمیت بیشتری برخوردار است.
در این مورد، کسب و کارها تمایل و البته نیاز به آن دارند که مشتریان رویگردان بالقوه را با دقت بالایی پیشبینی کنند، تا بتوانند با تدوین برنامههایی، مانع از رویگردانی آنها شوند. برای مثال، چنین مداخلهای میتواند شامل یک کمپین ایمیلی حاوی بنهای تخفیف و دیگر پیشنهادات ویژه، برای مشتریانی شود که قصد رویگردانی دارند. با انتخاب صحیح اینکه کدام مشتریان باید هدف گرفته شوند، کسب و کارها میتوانند هزینه چنین اقدامات نجاتبخش و پیشگیرانهای را کاهش و اثربخشی آنها را افزایش دهند.
کسب بینش از خروجی مدل
هنگامی که مدل انتخاب شد، میتوان تحلیلهایی را روی آن انجام داد. بررسی اینکه کدام ویژگیهای دادههای ورودی دربرگیرنده بیشترین اطلاعات برای موفقیت مدل هستند، میتواند حوزههایی را برای هدفگیری و بهبود مدل پیشنهاد دهد. حتی، دادههای کل مشتریان قابل تقسیم به چند بخش است. احتمالا، با استفاده از یک الگوریتم خوشهبندی مانند K-Means، این کار قابل انجام است.
این کار به کسب و کارها کمک میکند تا در بازارهای رقابتی حضور پیدا کنند و رویکردهای پیشگیری از رویگردانی مشتریان خود را برای رسیدن به اهداف کسب و کار، دنبال کنند. همچنین، میتوانند با اتکا به تفسیرپذیری بالای مدلی که انتخاب کردهاند (اگر چنین مدل تفسیرپذیری انتخاب شده باشد)، از آن برای شناسایی تصمیماتی که منجر به رویگردانی مشتریان میشود استفاده کنند.
مبارزه با رویگردانی مشتریان با استفاده از یادگیری ماشین
در حالی که پیشبینی رویگردانی یک وظیفه دلهرهآور به نظر میرسد، تفاوت ویژهای با دیگر وظایف یادگیری ماشین ندارد. کارهای مانند پیشبینی سرطان و سایر بیماریها و بسیاری از دیگر وظایف یادگیری ماشین نیز بسیار حائز اهمیت هستند و اشتباه کوچکی در خروجی، میتواند نه فقط به خسارتهای مالی که به خسارتهای جانی قابل توجهی منجر شود. با نگاهی تعمیمیافته، میتوان گفت که جریان کاری کلی برای پروژههای گوناگون یادگیری ماشین مشابه است و برای پروژه پیشبینی رویگردانی مشتریان نیز به همین صورت است.
اگرچه، مراقبتهای ویژهای باید در هنگام انتخاب ویژگیها، تفسیر مدل و تحلیلهای بعدی انجام شود تا سنجههای مناسبی برای کاهش رویگردانی انتخاب شوند. در این راه، مهارت کلیدی تطبیق دادن یادگیری ماشین برای پیشبینی رویگردانی مشتریان، نیازمند کسب دانش دامنه توسط کارشناس یادگیری ماشین و البته، استفاده مداوم از نظرات کارشناس این حوزه است.
اگر نوشته بالا برای شما مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای دادهکاوی و یادگیری ماشین
- گنجینه آموزشهای پیشبینی و تحلیل سریهای زمانی
- مجموعه آموزشهای مدیریت
- برترین الگوریتمهای پیشبینی در یادگیری ماشین
- پیشبینی ریزش مشتریان با دادهکاوی و R — راهنمای جامع
- پیشبینی قیمت سهام با کتابخانه کرس (Keras) — راهنمای کاربردی
- پیشبینی بورس با پایتون — آموزش جامع
^^