تحلیل احساسات در توییتر با زبان R – راهنمای کاربردی

۴۴۲

۱۴۰۲/۰۴/۱۷

۳ دقیقه

PDF

آموزش متنی جامع

امکان دانلود نسخه PDF

«تحلیل احساسات» (Sentiment Analysis) راهکاری قدرتمند برای اندازه‌گیری عقاید افراد پیرامون یک موضوع مشخص در برهه مشخصی از زمان است. در این مطلب، با استفاده از «بسته‌های» (Packages) زبان برنامه‌نویسی R شامل twitteR و tidytext تحلیل احساسات به منظور تعیین عواطف موجود پیرامون قیمت کنونی طلا استفاده شده است. پروژه انجام شده در این مطلب روی داده‌های انگلیسی صورت پذیرفته، ولیکن مفهوم و روش کلی پیاده‌سازی برای دیگر زبان‌ها نیز مشابه است. تفاوت‌ها تنها در بخش‌های مربوط به پردازش زبان طبیعی بروز می‌کند.

فهرست مطالب این نوشته

دانلود توییت‌ها با بسته twitteR

انجام تحلیل احساسات در توییتر با tidytext

نتیجه‌گیری

دانلود توییت‌ها با بسته twitteR

برای فراهم کردن امکان دانلود توئیت‌ها، باید برنامه کاربردی مناسب برای انجام آن را از این مسیر (+) ساخت. در مسیر مذکور، کاربر باید حساب کاربری بسازد که کدهای احراز هویت گوناگون برای اتصال به API را در اختیار او قرار می‌دهد.

فیلم آموزش متن کاوی Text Mining با زبان آر R در فرادرس

کلیک کنید

اکنون و در ابتدا، با استفاده از قطعه کد زیر، دسترسی را احراز هویت کرده و سپس، ۵۰۰ توییت مربوط به کلیدواژه جست‌و‌جوی «قیمت طلا» (gold prices) (توییت‌های به زبان انگلیسی) دانلود می‌شوند.

اکنون، توییت‌ها را از حالت لیست خارج کرده (به بردار تبدیل می‌شوند) و از dplyr برای ذخیره‌سازی آن‌ها به صورت یک مشاهده استفاده می‌شود.

انجام تحلیل احساسات در توییتر با tidytext

در ادامه، چگونگی انجام تحلیل عواطف با استفاده از tidytext (+) آموزش داده شده است. اکنون، «کلمات بازدارنده» (Stop Words)، پیش از انجام گام‌های دیگر از تحلیل‌ها حذف می‌شوند. کلمات بازدارنده به واژگانی گفته می‌شود که به طور متداول مورد استفاده قرار می‌گیرند، ولی الزاما ارزشی به تحلیل احساسات اضافه نمی‌کنند.

فیلم آموزش متن کاوی Text Mining با زبان آر R در فرادرس

کلیک کنید

بنابراین، باید آن‌ها را حذف کرد زیرا تعداد آن‌ها زیاد است و وجود آن‌ها مانع کسب هر گونه بینش مفیدی از داده‌ها طی انجام تحلیل‌ها می‌شود.

علاوه بر آن، لیستی از کلمات بازدارنده نیز در یک فایل متنی جدا ذخیره می‌شوند (شامل واژه‌های trump، twitter و gold) و آن‌ها نیز از تحلیل‌ها حذف می‌شوند. شایان توجه است که کلمه gold حذف می‌شود، زیرا tidytext آن را به عنوان یک کلمه مثبت در نظر می‌گیرد، اما در این مساله خاص، وجود آن مانع اندازه‌گیری احساسات صحیح نسبت به کالای طلا می‌شود.

اکنون، یک tibble ساخته شده که در آن وقوع هر کلمه در تحلیل‌ها اندازه‌گیری می‌شود، و سپس موتور احساسات Bing برای رتبه‌دهی به کلیدواژه‌ها مورد استفاده قرار می‌گیرد.

در تصویر زیر، تحلیل احساسات نشان داده شده است.

تحلیل احساسات در توییتر با زبان R

می‌توان مشاهده کرد که کلمات مثبت در تحلیل‌ها مانند «amazing» و «beautiful» الزاما بیانگر احساسات مثبت پیرامون مباحث مالی طلا نیستند. اگرچه، کلمات منفی نیز وجود دارند که به احساسات پیرامون موضوعات مالی طلا مربوط هستند و از آن جمله می‌توان به «risk» و «fall» اشاره کرد. با نگاهی به تصویر بالا، به نظر می‌رسد عواطف کلی نسبت به طلا از چشم‌انداز مالی «منفی» است.

فیلم آموزش متن کاوی Text Mining با زبان آر R در فرادرس

کلیک کنید

هنگامی که نگاهی به قیمت طلا طی ۲۴ ساعت گذشته انداخته می‌شود، مشهود است که قیمت طلا کاهش پیدا کرده و این می‌تواند پشتوانه‌ای برای عواطف منفی موجود نسبت به قیمت طلا در توییتر باشد.

تحلیل احساسات در توییتر با زبان R

نتیجه‌گیری

در این راهنما، چگونگی دانلود توییت‌ها با کتابخانه twitteR و انجام متن‌کاوی با استفاده از tidytext در زبان برنامه‌نویسی R آموزش داده شده است.

فیلم مجموعه آموزش داده کاوی و یادگیری ماشین – مقدماتی تا پیشرفته در فرادرس

کلیک کنید

همچنین، چگونگی انجام تحلیل احساسات در یک پروژه کاربردی (تحلیل احساسات پیرامون قیمت طلا با استفاده از داده‌های شبکه اجتماعی توییتر) مورد بررسی قرار گرفت.

اگر نوشته بالا برای شما مفید بود، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

محصول، خدمات یا برند خود را در مجله فرادرس معرفی کنید.

کلیک کنید

بر اساس رای ۲ نفر

آیا این مطلب برای شما مفید بود؟

اگر پرسشی درباره این مطلب دارید، آن را با ما مطرح کنید.

ثبت نظر

الهام حصارکی (+)

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

مطالب مرتبط