در این مطلب، آموزش نصب کتابخانه های پایتون علم داده به همراه توضیحات و مثال‌هایی از آن‌ها، ارائه شده است. «زبان برنامه‌نویسی پایتون» (Python Programming Language) یکی از محبوب‌ترین زبان‌های برنامه‌نویسی طی سال‌های اخیر محسوب می‌شود و به نظر می‌رسد که محبوبیت آن نیز روز به روز در حال افزایش است. دلایل گوناگونی پیرامون چرایی محبوبیت پایتون وجود دارد که یکی از مهم‌ترین آن‌ها کاربردهای پایتون در زمینه «علم داده» (Data Science) و «هوش مصنوعی» (Artificial Intelligence) است.

زبان برنامه‌نویسی پایتون، کتابخانه‌های متعددی برای محاسبات علمی، پردازش داده‌ها و «یادگیری ماشین» «Machine Learning» دارد. این کتابخانه‌های قدرتمند و با کارایی بالا، از اصلی‌ترین مزایای رقابتی پایتون در مقایسه با زبان‌هایی مانند «گو» (Go) محسوب می‌شوند. در این مطلب، ده تا از مهم‌ترین و کاربردی‌ترین کتابخانه‌های علم داده پایتون به همراه روش نصب آن‌ها معرفی شده‌اند.

آموزش نصب کتابخانه های پایتون علم داده

در ادامه، ده کتابخانه پایتون مهم و بسیار کاربردی برای علم داده معرفی شده‌اند. کاربرد هر یک از این کتابخانه‌ها به طور کوتاه به همراه روش نصب آن‌ها بیان شده است.

میسینگنو (MissingNo)

در مجموعه داده‌های واقعی، معمولا مقادیر از دست رفته یا همان «مقادیر ناموجود» (Missing Values) زیادی وجود دارند. یکی از گام‌های مهم طی «پیش‌پردازش» (Pre-Processing) داده‌ها، رسیدگی به مسئله مقادیر ناموجود و رفع آن‌ها است. زیرا برای ساخت یک مدل علم داده یا یادگیری ماشین، «مجموعه داده» (Data Set) باید کامل باشد. به همین دلیل، نیاز به روش‌هایی برای جایگذاری مقادیر ناموجود با مقادیر احتمالی است. اما پیش از انجام این کار، نیاز به کسب اطلاعات پیرامون چگونگی توزیع مقادیر ناموجود در مجموعه داده است. شایان ذکر است که مقادیر ناموجود را به صورت «NaN» که مخفف «Not a Number» است نمایش می‌دهند.

MissingNo مخفف عبارت Missing Number یا عدد ناموجود است. این کتابخانه، راهکار بسیار مناسبی برای بصری‌سازی توزیع مقادیر ناموجود است. این کتابخانه پایتون، با کتابخانه پایتون «پانداس» (Pandas) سازگار است. پس به طور خلاصه باید گفت که کتابخانه Missingno برای بصری‌سازی مقادیر ناموجود مورد استفاده قرار می‌گیرد.

نصب کتابخانه Missingno در پایتون و یک مثال

آموزش نصب کتابخانه های پایتون علم داده -- راهنمای کاربردی

پلاتلی (Plotly)

«بصری‌سازی» (Visualization) داده‌ها یکی از گام‌های مهم در فرایند «داده‌کاوی» (Data Mining) است. ارائه خروجی‌های قابل تفسیر و درک به ویژه برای ذینفعان پروژه، یکی از نکات مهمی است که طی بصری‌سازی داده‌ها باید به آن توجه داشت.

Plotly کتابخانه پایتون «متن‌باز» (Open Source) است که برای بصری‌سازی داده‌ها و در واقع، ترسیم نمودارها شامل نقشه‌ها، نمودارهای سه‌بُعدی و دیگر انواع نمودارها مورد استفاده قرار می‌گیرد.

نصب کتابخانه plotly در پایتون و یک مثال

سلنیوم (Selenium)

سلنیوم، کتابخانه انقیادهای پایتون برای Selenium WebDriver است. از کتابخانه پایتون سلنیوم می‌توان برای خودکارسازی تعامل‌های مرورگر وب استفاده کرد.

نصب کتابخانه selenium در پایتون و یک مثال

ژئوپانداس (Geopandas) و ژئوپای (Geopy)

کتابخانه‌های ژئوپانداس (Geopandas) و ژئوپای (Geopy) گزینه‌های بسیار مناسبی برای ترسیم نقشه‌ها هستند. برای آشنایی بیشتر با این مبحث، مطالعه مطالب «ترسیم داده های جغرافیایی در پایتون — راهنمای جامع» و «آموزش پایتون: ساخت اپلیکیشن نقشه وب — به زبان ساده» توصیه می‌شود.

نصب کتابخانه‌های geopandas و geopy در پایتون

پای ترنسلیتر (Py_translator)

از این کتابخانه برای ترجمه متن استفاده می‌شود. در مثالی که در قطعه کد زیر ارائه شده است، عبارت «!Hello World» از زبان انگلیسی به زبان فرانسه ترجمه و خروجی آن در یک فایل متنی به نام output.text ذخیره می‌شود.

هدف اصلی این کتابخانه، در دسترس بودن یک برنامه ساده برای ترجمه متن در ترمینال است. متن می‌توان به صورت تعاملی یا با برنامه‌نویسی در محیط شل تولید شود. از طریق آرگومان‌های خط فرمان، توصیف‌گرهای متن، خروجی ترجمه شده تولید می‌شود. این خروجی را همانطور که پیش از این نیز اشاره شد، می‌توان در یک فایل خروجی گرفت و یا، در ترمینال نمایش داد.

نصب کتابخانه‌های py_translator در پایتون و یک مثال

گراف‌ویز (Graphviz)

Graphviz سرنامی برای Graph Visualization Software به معنای نرم‌افزار بصری‌سازی گراف است. Graphviz بسته‌ای از ابزارهای متن‌باز است که از آن برای بصری‌سازی مدل‌های درختی استفاده می‌شود.

نصب کتابخانه‌های graphviz در پایتون و یک مثال

ژوپیترلب اسپل‌چکر (Jupyterlab_spellchecker)

این مورد، در حقیقت یک «افزونه» (Extension) برای ژوپیتر نوت‌بوک است. از این افزونه می‌توان برای بررسی گرامری بخشی از متن استفاده کرد که نشانه‌گذاری (Markdown) شده است.

نصب افزونه jupyterlab_spellchecker در ژوپیتر لب

ان‌بی اکستنشنز (Nbextensions)

این مورد در حقیقت یک کتابخانه پایتون نیست و یک افزونه (Extension) محسوب می‌شود. این افزونه امکانات جالبی را برای کاربر در «ژوپیتر نوت‌بوک» (Jupyter Notebook) فراهم می‌کند که از جمله آن‌ها می‌توان به خودکارسازی یک جدول از محتوا، زیباسازی کد و کد فولدینگ اشاره کرد.

نصب افزونه Nbextensions در ژوپیتر نوت‌بوک

توییتر اسکرپر (Twitter Scraper)

کتابخانه Twitter Scraper توییت‌ها را بر اساس تاریخ، موقعیت مکانی، کلمات و دیگر موارد اسکرپ می‌کند. البته، باید ضمن استفاده از این کتابخانه توجه داشت که سقف زمانی را برای پیشگیری از بلاک شدن توسط توییتر، تعیین کرد.

نصب کتابخانه Twitter scraperدر پایتون و یک مثال

ایمبالانسد لرن (Imbalanced-Learn)

این کتابخانه، دارای چندین روش نمونه‌برداری خودکار برای متوازن کردن کلاس‌ها است.

نصب کتابخانه Imbalanced-Learn در پایتون و یک مثال

اگر نوشته بالا برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

الهام حصارکی (+)

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

بر اساس رای 7 نفر

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *