متن کاوی با پایتون در توییتر – راهنمای جامع و کاربردی

۱۴۶۱ بازدید

آخرین به‌روزرسانی: ۳۰ بهمن ۱۴۰۲

زمان مطالعه: ۸ دقیقه

دانلود PDF مقاله

در این مطلب، روش انجام متن کاوی با پایتون در توییتر، همراه با ارائه یک مثال کامل، مورد بررسی قرار گرفته است.

فهرست مطالب این نوشته

متن کاوی با پایتون در توییتر

۱. دریافت داده‌های روبی با استفاده از Twitter Streaming API

۲. مطالعه و درک داده‌ها

۳. کاوش توییت‌ها

استخراج لینک‌ها از توییت‌های مرتبط

جمع‌بندی

متن کاوی با پایتون در توییتر

«متن‌کاوی» (Text Mining) یکی از کاربردهای «پردازش زبان طبیعی» (Natural Language Processing) و یک روش تحلیلی برای داده‌های متنی به منظور کسب اطلاعات مناسب از آن‌ها است. در سال‌های اخیر، متن‌کاوی توجهات زیادی را به خود جلب کرده است. دلیل این امر، افزایش داده‌های متنی دیجیتال در صفحات وب‌، پروژه‌های گوگل مانند «گوگل بوک» (Google Books) و «گوگل ان‌گرام» (Google ngram)، خدمات شبکه‌های اجتماعی مانند «توییتر» (Twitter) و دیگر موارد است.

فیلم آموزش اصول و روش های متن کاوی Text Mining در فرادرس

کلیک کنید

داده‌های توییتر منبعی غنی از اطلاعات هستند که می‌توان از آن‌ها برای کسب اطلاعات در موارد گوناگون مانند یافتن موضوعات داغ مرتبط با یک کلیدواژه، سنجش و تحلیل عواطف پیرامون یک برند، گردآوری بازخوردها پیرامون یک محصول یا سرویس جدید استفاده کرد. در این راهنما، از داده‌های توییتر برای مقایسه محبوبیت ۳ زبان برنامه‌نویسی «پایتون» (Python)، «جاوا اسکریپت» (Java Script) و «روبی» (Ruby) و آموزش‌های مورد استفاده توسط افراد برای یادگیری این زبان‌ها، استفاده شده است. در اولین بخش از این مطلب، چگونگی اتصال به «رابط برنامه‌نویسی کاربردی استریم توییتر» (Twitter Streaming API) و چگونگی دریافت داده‌های توییتر پرداخته می‌شود. در بخش دوم از این راهنما، چگونگی ساختاردهی به داده‌ها برای انجام تحلیل‌ها و در بخش آخر، چگونگی فیلتر کردن داده‌ها برای استخراج لینک‌ها از توییت‌ها استفاده شده است.

برای انجام آنچه بیان شد، از داده‌های دو روز توییتر استفاده شده است. از این داده‌ها، ۶۴۴ لینک به آموزش‌های پایتون، ۴۱۳ لینک به آموزش‌های جاوا اسکریپت و ۱۳۶ لینک به آموزش‌های روبی بازیابی شده است. بر این اساس، می‌توان گفت که محبوبیت پایتون، در زمان انجام پروژه، ۱/۵ برابر بیش‌تر از جاوا اسکریپت و ۴ برابر بیشتر از روبی بوده است.

۱. دریافت داده‌های روبی با استفاده از Twitter Streaming API

API مخفف Application Programming Interface یا همان رابط برنامه‌نویسی کاربردی است. API ابزاری است که با برنامه‌های کامپیوتری و سرویس‌های وب به سادگی تعامل می‌کند. بسیاری از ارائه‌دهندگان خدمات وب، رابط‌های برنامه‌نویسی کاربردی را برای توسعه‌دهندگان به منظور فراهم کردن امکان تعامل به خدمات آن‌ها و دسترسی به داده‌ها به شیوه برنامه‌نویسی (Programmatic) ارائه می‌کنند.

فیلم آموزش مقدماتی برنامه نویسی روبی Ruby در فرادرس

کلیک کنید

در این مطلب، از Twitter Streaming API برای دانلود توییت‌های مرتبط با سه کلیدواژه «javascript» ،«python» و «ruby» استفاده شده است.

گام اول: دریافت کلیدهای رابط برنامه‌نویسی کاربردی توییتر

به منظور دسترسی داشتن به Twitter Streaming API نیاز به چهار تکه اطلاعات از توییتر است. این چهار تکه اطلاعات عبارت هستند از: کلید API (یا همان API Key)، راز API (یا همان API Secret)، توکن دسترسی (Access Token) و «رمز توکن دسترسی» (Access Token Secret). برای به دست آوردن این چهار تکه اطلاعات، باید گام‌های زیر را انجام داد.

یک اکانت توییتر باید ساخته شود. افرادی که در حال حاضر توییتر دارند، نیاز به انجام این کار ندارند.
به این صفحه [+] رفته و با اطلاعات اکانت توییتر مورد نظر، ورود (Log In) انجام شود.
روی گزینه «Create New App» کلیک شود.
فرم موجود تکمیل، با شرایط و قواعد موافقت و روی گزینه «Create your Twitter application» کلیک شود.
در صفحه بعد، روی سربرگ «API keys» کلیک و «API key» و «API secret» کپی شوند.
روی صفحه به پایین اسکرول و روی گزینه «Create my access token» کلیک شود. سپس، «Access token» و «Access token secret» کپی شوند.

گام دوم: اتصال به Twitter Streaming APIو دانلود داده‌ها

در اینجا از کتابخانه زبان برنامه‌نویسی پایتون به نام «Tweepy» برای اتصال به Twitter Streaming API و دانلود داده‌ها استفاده شده است. بنابراین، مخاطبانی که Tweepy را پیش از این نصب نکرده‌اند، برای انجام مراحلی که در ادامه بیان شده است، ابتدا باید آن را دانلود و نصب کنند.

فیلم آموزش تجزیه و تحلیل و آماده سازی داده ها با پایتون Python در فرادرس

کلیک کنید

سپس، باید فایلی به نام twitter_streaming.py ساخته شود. پس از آن، باید کد زیر را در آن فایل کپی کرد. همچنین، باید اطمینان حاصل کرد که اطلاعات اعتباری در consumer_key ،access_token_secret ،access_token و consumer_secret وارد شوند.

1#Import the necessary methods from tweepy library
2from tweepy.streaming import StreamListener
3from tweepy import OAuthHandler
4from tweepy import Stream
5
6#Variables that contains the user credentials to access Twitter API 
7access_token = "ENTER YOUR ACCESS TOKEN"
8access_token_secret = "ENTER YOUR ACCESS TOKEN SECRET"
9consumer_key = "ENTER YOUR API KEY"
10consumer_secret = "ENTER YOUR API SECRET"
11
12
13#This is a basic listener that just prints received tweets to stdout.
14class StdOutListener(StreamListener):
15
16    def on_data(self, data):
17        print data
18        return True
19
20    def on_error(self, status):
21        print status
22
23
24if __name__ == '__main__':
25
26    #This handles Twitter authetification and the connection to Twitter Streaming API
27    l = StdOutListener()
28    auth = OAuthHandler(consumer_key, consumer_secret)
29    auth.set_access_token(access_token, access_token_secret)
30    stream = Stream(auth, l)
31
32    #This line filter Twitter Streams to capture data by the keywords: 'python', 'javascript', 'ruby'
33    stream.filter(track=['python', 'javascript', 'ruby'])

مشاهده کامل کدها

در صورت اجرای این برنامه از ترمینال با استفاده از دستور python twitter_streaming.py، خروجی زیر به کاربر نمایش داده خواهد شد.

متن کاوی با پایتون در توییتر -- راهنمای جامع و کاربردی

این برنامه را می‌توان با فشردن کلیدهای ترکیبی Ctrl-C متوقف کرد. هدف ثبت این داده‌ها در یک فایل است که بعدا برای تحلیل‌ها مورد استفاده قرار می‌گیرد. این کار را می‌توان با پایپ کردن خروجی به یک فایل با استفاده از دستور زیر انجام داد.

1python twitter_streaming.py > twitter_data.txt

برنامه برای دو روز اجرا شده است (از ۲۰۱۴/۰۷/۱۵ تا ۲۰۱۴/۰۷/۱۷) تا نمونه داده‌های معناداری حاصل شوند. سایز فایل حاصل شده، ۲۴۲ مگابایت است.

۲. مطالعه و درک داده‌ها

داده‌های ذخیره شده در twitter_data.txt در فرمت JSON هستند. JSON سرنامی برای «JavaScript Object Notation» است. این فرمت، خواندن داده‌ها را برای انسان‌ها و تجزیه آن را برای ماشین‌ها، آسان می‌کند.

فیلم آموزش تجزیه و تحلیل و آماده سازی داده ها با پایتون Python در فرادرس

کلیک کنید

در ادامه، مثالی از یک توئیت در فرمت JSON داده شده است. می‌توان مشاهده کرد که توئیت علاوه بر متن اصلی حاوی اطلاعات افزوده است؛ این اطلاعات، در این مثال، به صورت زیر هستند:

"Yaayyy I learned some JavaScript today! #thatwasntsohard #yesitwas #stoptalkingtoyourself #hashbrown #hashtag"

{"created_at":"Tue Jul 15 14:19:30 +0000 2014","id":489051636304990208,"id_str":"489051636304990208","text":"Yaayyy I learned some JavaScript today! #thatwasntsohard #yesitwas #stoptalkingtoyourself #hashbrown #hashtag","source":"\u003ca href=\"http:\/\/twitter.com\/download\/iphone\" rel=\"nofollow\"\u003eTwitter for iPhone\u003c\/a\u003e","truncated":false,"in_reply_to_status_id":null,"in_reply_to_status_id_str":null,"in_reply_to_user_id":null,"in_reply_to_user_id_str":null,"in_reply_to_screen_name":null,"user":{"id":2301702187,"id_str":"2301702187","name":"Toni Barlettano","screen_name":"itsmetonib","location":"Greater NYC Area","url":"http:\/\/www.tonib.me","description":"So Full of Art   |   \nToni Barlettano Creative Media + Design","protected":false,"followers_count":8,"friends_count":25,"listed_count":0,"created_at":"Mon Jan 20 16:49:46 +0000 2014","favourites_count":6,"utc_offset":null,"time_zone":null,"geo_enabled":false,"verified":false,"statuses_count":20,"lang":"en","contributors_enabled":false,"is_translator":false,"is_translation_enabled":false,"profile_background_color":"C0DEED","profile_background_image_url":"http:\/\/abs.twimg.com\/images\/themes\/theme1\/bg.png","profile_background_image_url_https":"https:\/\/abs.twimg.com\/images\/themes\/theme1\/bg.png","profile_background_tile":false,"profile_image_url":"http:\/\/pbs.twimg.com\/profile_images\/425313048320958464\/Z2GcderW_normal.jpeg","profile_image_url_https":"https:\/\/pbs.twimg.com\/profile_images\/425313048320958464\/Z2GcderW_normal.jpeg","profile_link_color":"0084B4","profile_sidebar_border_color":"C0DEED","profile_sidebar_fill_color":"DDEEF6","profile_text_color":"333333","profile_use_background_image":true,"default_profile":true,"default_profile_image":false,"following":null,"follow_request_sent":null,"notifications":null},"geo":null,"coordinates":null,"place":null,"contributors":null,"retweet_count":0,"favorite_count":0,"entities":{"hashtags":[{"text":"thatwasntsohard","indices":[40,56]},{"text":"yesitwas","indices":[57,66]},{"text":"stoptalkingtoyourself","indices":[67,89]},{"text":"hashbrown","indices":[90,100]},{"text":"hashtag","indices":[101,109]}],"symbols":[],"urls":[],"user_mentions":[]},"favorited":false,"retweeted":false,"filter_level":"medium","lang":"en"}

در ادامه این مطلب، از چهار کتابخانه پایتون استفاده خواهد شد. این کتابخانه‌ها عبارتند از json برای تجزیه داده‌ها، «پانداس» (Pandas) برای دستکاری داده‌ها، «مت‌پلات‌لیب» (Matplotlib) برای ساخت نمودارها و re برای عبارات با قاعده. کتابخانه‌های json و re به طور پیش‌فرض در پایتون نصب هستند. اما در صورتی که پانداس و مت‌پلات‌لیب پیش از این توسط کاربر نصب نشده‌اند، برای ادامه این پروژه، باید آن‌ها را نصب کرد. اکنون، کار ابتدا با بارگذاری json و پانداس با استفاده از دستور زیر آغاز می‌شود.

1import json
2import pandas as pd
3import matplotlib.pyplot as plt

سپس، داده‌ها در یک آرایه که tweets نامیده می‌شود، خوانده می‌شوند.

1tweets_data_path = '../data/twitter_data.txt'
2
3tweets_data = []
4tweets_file = open(tweets_data_path, "r")
5for line in tweets_file:
6    try:
7        tweet = json.loads(line)
8        tweets_data.append(tweet)
9    except:
10        continue

می‌توان تعداد توییت‌ها را با استفاده از دستور زیر، چاپ کرد. برای مجموعه داده‌ای که در این مطلب استفاده شده است، تعداد توییت‌ها برابر با ۷۱۲۳۸ است.

1print len(tweets_data)

سپس، داده‌های توییت‌ها در دیتافریم پانداس ساختاردهی می‌شوند تا دستکاری آن‌ها آسان‌تر شود. کار با ساخت یک دیتافریم خالی به نام tweets با استفاده از دستور زیر، آغاز می‌شود.

1tweets = pd.DataFrame()

سپس، سه ستون به دیتافریم tweets اضافه می‌شود که lang ،text و country نامیده می‌شوند. ستون text حاوی توییت، lang حاوی زبانی که توییت به آن نوشته شده و country، کشوری است که توییت از آن ارسال شده است.

1tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
2tweets['lang'] = map(lambda tweet: tweet['lang'], tweets_data)
3tweets['country'] = map(lambda tweet: tweet['place']['country'] if tweet['place'] != None else None, tweets_data)

سپس، دو نمودار ساخته می‌شود. نمودار اول ۵ زبان برتری که توییت‌ها به آن‌ها نوشته شده است و زبان دوم، ۵ کشور برتری که توییت‌ها از آن‌ها ارسال شده است را نشان می‌دهد.

1tweets_by_lang = tweets['lang'].value_counts()
2
3fig, ax = plt.subplots()
4ax.tick_params(axis='x', labelsize=15)
5ax.tick_params(axis='y', labelsize=10)
6ax.set_xlabel('Languages', fontsize=15)
7ax.set_ylabel('Number of tweets' , fontsize=15)
8ax.set_title('Top 5 languages', fontsize=15, fontweight='bold')
9tweets_by_lang[:5].plot(ax=ax, kind='bar', color='red')

متن کاوی با پایتون در توییتر -- راهنمای جامع و کاربردی

1tweets_by_country = tweets['country'].value_counts()
2
3fig, ax = plt.subplots()
4ax.tick_params(axis='x', labelsize=15)
5ax.tick_params(axis='y', labelsize=10)
6ax.set_xlabel('Countries', fontsize=15)
7ax.set_ylabel('Number of tweets' , fontsize=15)
8ax.set_title('Top 5 countries', fontsize=15, fontweight='bold')
9tweets_by_country[:5].plot(ax=ax, kind='bar', color='blue')

متن کاوی با پایتون در توییتر -- راهنمای جامع و کاربردی

۳. کاوش توییت‌ها

هدف اصلی در این پروژه متن‌کاوی، مقایسه محبوبیت زبان‌های برنامه‌نویسی پایتون، روبی و جاوا اسکریپت و بازیابی لینک آموزش‌های برنامه‌نویسی داده شده است. این کار در سه گام انجام می‌شود.

فیلم آموزش اصول و روش های متن کاوی Text Mining در فرادرس

کلیک کنید

به دیتافریم tweets تگ‌هایی به منظور فراهم کردن امکان دستکاری راحت‌تر داده‌ها، اضافه می‌شود.
توئیت‌هایی که کلیدواژه‌های «pogramming» یا «tutorial» را دارند، هدف‌ قرار می‌گیرند.
استخراج لینک‌ها از توئیت‌های مرتبط انجام می‌شود.

گام اول: افزودن تگ‌های پایتون، روبی و جاوا اسکریپت

ابتدا، تابعی ساخته می‌شود که بررسی می‌کند آیا یک کلیدواژه در یک متن وجود دارد یا خیر. این کار با استفاده از «عبارات با قاعده» (Regular Expressions) انجام می‌شود. پایتون یک کتابخانه برای عبارات با قاعده به نام re دارد. این کار با وارد کردن (ایمپورت | Import) این کتابخانه انجام می‌شود.

1import re

سپس، تابعی ساخته می‌شود که word_in_text(word, text)‎ نامیده می‌شود. این تابع در صورتی که word در text پیدا شود، True است؛ در غیر این صورت، مقدار False را باز می‌گرداند.

1def word_in_text(word, text):
2    word = word.lower()
3    text = text.lower()
4    match = re.search(word, text)
5    if match:
6        return True
7    return False

سپس، سه ستون به دیتافریم tweets اضافه می‌شود.

1tweets['python'] = tweets['text'].apply(lambda tweet: word_in_text('python', tweet))
2tweets['javascript'] = tweets['text'].apply(lambda tweet: word_in_text('javascript', tweet))
3tweets['ruby'] = tweets['text'].apply(lambda tweet: word_in_text('ruby', tweet))

می‌توان تعداد توییت‌ها را برای هر زبان برنامه‌نویسی با استفاده از قطعه کد زیر محاسبه کرد.

1print tweets['python'].value_counts()[True]
2print tweets['javascript'].value_counts()[True]
3print tweets['ruby'].value_counts()[True]

این قطعه کد، موارد زیر را در خروجی باز می‌گرداند.

21839 for python, 16154 for javascript and 31410 for ruby

می‌توان یک نمودار مقایسه‌ای ساده را با اجرای قطعه کد زیر، ترسیم کرد.

1prg_langs = ['python', 'javascript', 'ruby']
2tweets_by_prg_lang = [tweets['python'].value_counts()[True], tweets['javascript'].value_counts()[True], tweets['ruby'].value_counts()[True]]
3
4x_pos = list(range(len(prg_langs)))
5width = 0.8
6fig, ax = plt.subplots()
7plt.bar(x_pos, tweets_by_prg_lang, width, alpha=1, color='g')
8
9# Setting axis labels and ticks
10ax.set_ylabel('Number of tweets', fontsize=15)
11ax.set_title('Ranking: python vs. javascript vs. ruby (Raw data)', fontsize=10, fontweight='bold')
12ax.set_xticks([p + 0.4 * width for p in x_pos])
13ax.set_xticklabels(prg_langs)
14plt.grid()

مشاهده کامل کدها

متن کاوی با پایتون در توییتر -- راهنمای جامع و کاربردی

نمودار بالا نشان می‌دهد که کلیدواژه ruby، محبوب‌ترین است و پس از آن، python و سپس javascript قرار دارد. اگرچه، دیتافریم tweets حاوی اطلاعاتی پیرامون همه توییت‌هایی است که حاوی یکی از سه کلیدواژه هستند و اطلاعات را به زبان‌های برنامه‌نویسی محدود نمی‌کند. برای مثال، توئیت‌های زیادی وجود دارند که حاوی کلیدواژه ruby هستند و مرتبط با رسوایی سیاسی به نام Rubygate است. در بخش بعدی، توئیت‌ها فیلتر می‌شوند و تحلیل‌ها برای انجام مقایسه‌های صحیح‌تر، دوباره اجرا می‌شود.

گام دوم: هدف‌گیری توییت‌های مرتبط

در اینجا، قصد آن است که توییت‌هایی که مرتبط با زبان‌های برنامه‌نویسی هستند هدف قرار داده شوند. چنین توییت‌هایی معمولا یکی از دو کلیدواژه «programming» یا «tutorial» را در خود دارند. در اینجا دو ستون جدید برای دیتافریم tweets ساخته می‌شود که در آن ستون‌ها، این اطلاعات اضافه می‌شوند.

1tweets['programming'] = tweets['text'].apply(lambda tweet: word_in_text('programming', tweet))
2tweets['tutorial'] = tweets['text'].apply(lambda tweet: word_in_text('tutorial', tweet))

یک ستون افزوده به نام relevant نیز ساخته می‌شود که در صورتی که توییت‌ها حاوی کلیدواژه‌های «programming» و یا «tutorial» باشند، مقدار True و در غیر این صورت، مقدار False به خود می‌گیرد.

1tweets['relevant'] = tweets['text'].apply(lambda tweet: word_in_text('programming', tweet) or word_in_text('tutorial', tweet))

می‌توان شمار توییت‌های مرتبط را با اجرای دستور زیر، در خروجی چاپ کرد.

1print tweets['programming'].value_counts()[True]
2print tweets['tutorial'].value_counts()[True]
3print tweets['relevant'].value_counts()[True]

قطعه کد بالا، ۸۷۱ را در ستون programming، عدد ۵۱۱ را در ستون tutorial و ۱۳۵۶ را در ستون relevant، باز می‌گرداند. اکنون، می‌توان محبوبیت زبان‌های برنامه‌نویسی را با اجرای دستور زیر مقایسه کرد.

1print tweets[tweets['relevant'] == True]['python'].value_counts()[True]
2print tweets[tweets['relevant'] == True]['javascript'].value_counts()[True]
3print tweets[tweets['relevant'] == True]['ruby'].value_counts()[True]

پایتون، محبوب‌ترین زبان با ۷۳۲ مورد است. پس از پایتون، جاوا اسکریپت با ۴۷۳ مورد و در نهایت، روبی با ۱۸۵ مورد قرار دارد. می‌توان نمودار مقایسه این موارد را با استفاده از دستور زیر، ترسیم کرد.

1tweets_by_prg_lang = [tweets[tweets['relevant'] == True]['python'].value_counts()[True], 
2                      tweets[tweets['relevant'] == True]['javascript'].value_counts()[True], 
3                      tweets[tweets['relevant'] == True]['ruby'].value_counts()[True]]
4x_pos = list(range(len(prg_langs)))
5width = 0.8
6fig, ax = plt.subplots()
7plt.bar(x_pos, tweets_by_prg_lang, width,alpha=1,color='g')
8ax.set_ylabel('Number of tweets', fontsize=15)
9ax.set_title('Ranking: python vs. javascript vs. ruby (Relevant data)', fontsize=10, fontweight='bold')
10ax.set_xticks([p + 0.4 * width for p in x_pos])
11ax.set_xticklabels(prg_langs)
12plt.grid()

استخراج لینک‌ها از توییت‌های مرتبط

اکنون که توییت‌های مرتبط استخراج شدند، هدف بازیابی لینک‌های مربوط به آموزش‌های برنامه‌نویسی است. کار با ساخت تابعی آغاز می‌شود که از عبارات با قاعده برای بازیابی لینک‌هایی از متن که با «http://‎» یا «https://‎» شروع می‌شوند استفاده می‌کند.

فیلم آموزش پردازش زبان های طبیعی NLP در پایتون Python با پلتفرم NLTK در فرادرس

کلیک کنید

این تابع، در صورتی که url پیدا شود آن را باز می‌گرداند و در غیر این صورت، یک رشته خالی باز می‌گرداند.

1def extract_link(text):
2    regex = r'https?://[^\s<>"]+|www\.[^\s<>"]+'
3    match = re.search(regex, text)
4    if match:
5        return match.group()
6    return ''

سپس، یک ستون به نام link به دیتافریم tweets اضافه می‌شود. این ستون حاوی اطلاعات url است.

1tweets['link'] = tweets['text'].apply(lambda tweet: extract_link(tweet))

سپس، یک دیتافریم جدید به نام tweets_relevant_with_link ساخته می‌شود. این دیتافریم یک زیرمجموعه از دیتافریم tweets و حاوی همه توییت‌های مرتبطی است که دارای لینک هستند.

1tweets_relevant = tweets[tweets['relevant'] == True]
2tweets_relevant_with_link = tweets_relevant[tweets_relevant['link'] != '']

اکنون می‌توان همه لینک‌ها را برای javascript ،python و ruby، با اجرای دستور زیر، چاپ کرد.

1print tweets_relevant_with_link[tweets_relevant_with_link['python'] == True]['link']
2print tweets_relevant_with_link[tweets_relevant_with_link['javascript'] == True]['link']
3print tweets_relevant_with_link[tweets_relevant_with_link['ruby'] == True]['link']

با اجرای قطعه کد بالا، ۶۴۴ لینک برای پایتون، ۴۱۳ لینک برای جاوا اسکریپت و ۱۳۶ مورد برای پایتون یافت شده است.

جمع‌بندی

در این راهنما، روش‌های گوناگونی برای متن کاوی با پایتون در توییتر مورد استفاده قرار گرفتند. کدهای مورد استفاده در این مطلب را می‌توان برای انجام تحلیل‌های عمیق‌تر و سازگارسازی آن‌ها با مسائل دیگر، ویرایش کرد.

فیلم مجموعه آموزش داده کاوی و یادگیری ماشین – مقدماتی تا پیشرفته در فرادرس

کلیک کنید

اگر نوشته بالا برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

محصول، خدمات یا برند خود را در مجله فرادرس معرفی کنید.

کلیک کنید

بر اساس رای ۰ نفر

آیا این مطلب برای شما مفید بود؟

اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

ثبت نظر

منابع:

adilmoujahid

الهام حصارکی (+)

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

۴ دیدگاه برای «متن کاوی با پایتون در توییتر – راهنمای جامع و کاربردی»

۲۰ شهریور، در ۱۳۹۹ ۱۱:۰۶ ق.ظ

سلام
تشکر از محتوای آموزش خوب و مفیدتون.
موضوع پایان نامه من در خصوص متن کاوی هستش ، لطف اگه در این زمینه میتونید کمک کنید ایمیل بزنید. ممنون

پاسخ

مژگان

۰۹ شهریور، در ۱۳۹۹ ۶:۴۰ ب.ظ

سلام وقت بخیر
من جدیدا از توئیتر api گرفتم . فرمت api عوض شده و بجای دو token یکی تحت عنوان bearer token داده.
کد رو چطوری باید عوض کنم؟
ممنون میشم راهنمایی کنین

پاسخ

مژگان

۰۹ شهریور، در ۱۳۹۹ ۴:۴۲ ب.ظ

سلام
من از توییتر درخواست api کردم، اما چیزی که به من داده سه بخشه
Api key
Api secret key
Bearer token
چیکار باید کنم؟
شما گفتین 4 بخشه
لطفا راهنمایی کنین
ممنونم

پاسخ

الهام حصارکی

۱۰ شهریور، در ۱۳۹۹ ۹:۲۲ ق.ظ

با سلام؛

از همراهی شما با مجله فرادرس سپاس‌گزاریم. نرم‌افزارها در طول زمان به روز رسانی می‌شوند و تغییر می‌کنند و از این رو سایر کدهایی که برای کار با آن‌ها نوشته می‌شوند نیز گاه نیازمند اصلاح و به روز رسانی هستند. API توئیتر نیز احتمالا از زمان نگارش این مطلب به بعد، دچار تغییراتی شده است که این مورد نیز از آن جمله است. در این راستا، شما باید کد را متناسب با API جدید بنویسید و سایر تغییرات احتمالی را نیز در آن اعمال کنید.

نظر شما چیست؟

برچسب‌ها

متن کاوی با پایتون در توییتر – راهنمای جامع و کاربردی

متن کاوی با پایتون در توییتر

۱. دریافت داده‌های روبی با استفاده از Twitter Streaming API

گام اول: دریافت کلیدهای رابط برنامه‌نویسی کاربردی توییتر

گام دوم: اتصال به Twitter Streaming APIو دانلود داده‌ها

۲. مطالعه و درک داده‌ها

۳. کاوش توییت‌ها

گام اول: افزودن تگ‌های پایتون، روبی و جاوا اسکریپت

گام دوم: هدف‌گیری توییت‌های مرتبط

استخراج لینک‌ها از توییت‌های مرتبط

جمع‌بندی

هوش مصنوعی دیپ سیک چیست؟ – آموزش استفاده و کاربردهای DeepSeek

یادگیری ماشین دکتر شریفی زارچی – فیلم آموزش کامل تمام جلسات

args* و kwargs** در پایتون – توضیح به زبان ساده

۱۴ سایت ساخت چهره با هوش مصنوعی رایگان و پولی که باید بشناسید

Seaborn در پایتون چیست؟ – به زبان ساده + نحوه نصب

شکل دهنده های پرامپت چیست؟ – بهبود پاسخ های هوش مصنوعی با پرامپت دکوریتورها

گسترش عکس با هوش مصنوعی آنلاین – معرفی ۱۰ بهترین سایت و برنامه

هوش مصنوعی آنلاین – ۵۲ بهترین سایت برای کارهای مختلف

آموزش نصب Tkinter در پایتون – راهنمای گام به گام تصویری

RAG چیست؟ – از طرز کار تا کاربردها و پیاده‌سازی