ابزارهای نرم افزاری ضروری برای پروژه های علوم داده | راهنمای کاربردی


در این مقاله به بررسی برخی ابزارهای نرم افزاری ضروری برای پروژه های علوم داده و تنظیمات آنها برای ایجاد یک گردش کاری با بهرهوری بالا و کار تیمی در حوزه علوم داده میپردازیم. این راهنما به طور عمده برای افرادی مفید است که به تازگی شروع به کار روی پروژههای یادگیری ماشین کردهاند. همچنین برای برخی دانشمندان علوم داده که میخواهند رایانه جدیدی را برای استفاده در این حوزه پیکربندی کنند، جهت یادآوری پارهای موارد مفید خواهد بود.
توجه کنید که منظور از نرمافزار ضروری در عنوان این مقاله تا حدود زیادی بر مبنای سلیقه و ترجیح شخصی نگارنده است و بسیار محتمل است که ترجیح خواننده محترم با آن در تقابل باشد. از این رو میتوانید پیشنهادهای خود را در بخش نظرات این نوشته در انتهای همین صفحه درج کنید. همه ابزارهایی که در این مقاله معرفی میشوند رایگان هستند و به سادگی میتوانید آنها را تهیه و مورد استفاده قرار دهید. دستورالعملهای ارائه شده در این راهنما بر پایه سیستم عامل macOS نسخه 10.15 ارائه شدهاند. با این حال نصب این نرمافزارها در محیط لینوکس یا ویندوز نیز احتمالاً به همین سادگی خواهد بود.
فهرست مطالبی که در این نوشته ارائه میشوند، به صورت زیر است و شما میتوانید در صورت نیاز هر یک از بخشها را رد کرده و به سراغ بخشی که مورد نیازتان است بروید.
- Git: کنترل نسخه و پشتیبانگیری از کد یک ضرورت است. گیتهاب به ما امکان میدهد که یک README مناسب برای پروژه بسازیم و حتی میتوانیم وبسایت خود را به رایگان روی آن میزبانی کنیم.
- Python: راهاندازی محیط مجازی برای نصب پکیج و انتساب ماکروی استایلبندی زیبای پیشفرض.
- VS Code: یک روش پیشرفته برای استفاده از نتبوکهای پایتون.
- Notion: برای ایجاد و اشتراک یادداشتهای زیبا در مورد یک پروژه.
- Grammarly: بهبود مهارتهای نگارشی.
پیش از ادامه این مبحث لازم است یادآور شویم که میتوانید ابزارهای علم داده را با استفاده از مجموعه آموزش ابزارهای علم داده فرادرس یاد بگیرید.
گیت
در این بخش فرض ما بر این است که شما تا حدودی با گیت و گیتهاب آشنا هستید.
اگر فکر میکنید که باید در این خصوص مطالبی بیاموزید و یا اطلاعات خود را یادآوری کنید، میتوانید از مطلب زیر استفاده کنید:
مؤثرترین روش برای تعامل با ریپازیتوری گیتهاب از طریق یک اپلیکیشن ترمینال مانند iTerm2 است (روی سیستمهای مک) که یکپارچگی شگفتانگیزی با گیت ارائه میکند و با ارائه پیشنهادهای خودکار، هایلایت کردن سینتکس و موارد مشابه به بهبود فرایند کار، کمک شایان توجهی میکند. علاوه بر این موارد امکان باز کردن تصاویر (و گیف) به صورت مستقیم در ترمینال نیز فراهم میشود.
پروژه شما شایسته چیزی فراتر از یک صفحه ساده README است و از این رو میتوانید یک توصیف پروژه زیبا برای آن بنویسید و برخی مدالها (Badges) مانند تصویر زیر بر آن بیفزایید.
در نهایت اگر نیاز به یک وبسایت برای میزبانی پروژه خود داشته باشید، یا اگر به یک پورتفولیوی آنلاین برای نمایش چندین پروژه نیاز دارید، گیتهاب ابزارهایی برای سهولت انجام این کار ارائه کرده است. یک روش خوب برای به دست آوردن برخی مهارتهای HTML و CSS این است که یک قالب وبسایت رایگان را از HTML5 UP (+) دانلود کرده و شروع به دستکاری آن بکنید.
پایتون
در این بخش به توضیح روش نصب لوکال پکیجهای پایتون با استفاده از pip و virtualenv میپردازیم.
اگر نیاز داشته باشید که جدیدترین نسخه از پایتون را به دست آورید، میتوانید از دستور زیر بهره بگیرید:
brew install python
دستور فوق جدیدترین نسخه از python و pip را روی سیستم شما نصب میکند. اگر از قبل نسخهای قدیمی از پایتون مثلاً نسخه 2 روی سیستم نصب باشد، و دستور python به آن لینک شده باشد (این موضوع را با اجرای دستور python –version بررسی کنید)، در این صورت brew دستورهای python3 و pip3 را به شما ارائه میکند.
ابتدا ابزار مدیریت محیط را با دستور زیر نصب میکنیم:
pip install virtualenv
در صورتی که از پایتون نسخه 2 استفاده میکنید، در دستور فوق از pip3 استفاده کنید. در ادامه یک دایرکتوری جدید ایجاد کرده و محیط جدیدی از پایتون را در داخل آن وهلهسازی میکنیم:
mkdir ~/my_project && cd ~/my_project && virtualenv my_project_env
این کار به ما امکان میدهد که پکیجهای پایتون را در آن محیط نصب کنیم که رویهای مخالف با نصب «سراسری» (global) پکیجها محسوب میشود. این محیط باید با دستور زیر فعالسازی شود:
source ~/my_project/bin/activate
اینک باید my_project_env را در ترمینال خود ببینید. اگر پکیجهای زیادی برای نصب دارید، کافی است آنها را در یک فایل لیست کنید. بدین ترتیب میتوانید نسخههای آنها را نیز در فایل requirements.txt تعیین کنید:
matplotlib==3.1.3 scikit-learn==0.22 tensorflow==2.1.0
سپس از pip میخواهیم که آنها را به صورت یکباره در my_project_env نصب کند:
pip install -r requirements.txt
استایل پیشفرض Matplotlib پایتون
اگر میخواهید پلاتهای شما ظاهر زیباتری نسبت به گزینهای پیشفرض Matplotlib داشته باشند، میتوانید یک استایل سفارشی Matplotlib تعیین کنید.
به مثال زیر توجه کنید:
برای به دست آوردن چنین استایلی میتوانید فایل ماکروی ml_style.mplstyle (+) را دانلود کرده و این خطوط را به کد پایتون یا ژوپیتر خود اضافه کنید:
import matplotlib.pyplot as plt plt.style.use('ml_style.mplstyle')
VSCode
برخی افراد در خصوص عدم واکنشگرایی در زمان سوئیچ کردن بین زبانههای مختلف یک نتبوک بزرگ در ژوپیتر نگرانیهایی دارند. از زمان گذار به VSCode دیگر هیچ نگرانی در مورد ژوپیتر نداریم و همه کارکردهای نتبوکهای پایتون در آن وجود دارند. به علاوه VSCode یک ادیتور قدرتمند برای پایتون، C، لاتک و انواع دیگر فایلها محسوب میشود. علاوه بر آن VSCode را میتوان طوری تنظیم کرد که برخی میانبرها و رفتارهای ادیتورهای محبوب دیگر از قبیل Sublime یا Atom را نیز داشته باشد.
شما میتوانید به یک نشست ژوپیتر ریموت که در حال اجرا است، برای نمونه روی سرور اوبونتو برای آموزش شبکه عصبی وصل شوید.
Notion
Notion یک پلتفرم قدرتمند برای یادداشتها و ایجاد مستندات محسوب میشود. Notion دو هدف دارد که یکی ایجاد سازماندهی در امور و دیگری فراهم ساختن امکان اشتراک یادداشتها با افراد دیگر است. بدین ترتیب Notion امکان سازماندهی مستندات و همچنین ایجاد وظایف، قالبها، همایشها، جاسازی کدها و موارد زیاد دیگر را به سهولت فراهم میآورد.
شما با استفاده از یک ایمیل با مشخصات دانشگاهی مانند ایمیلهایی که به edu یا .ac.ir ختم میشوند، میتوانید نسخه حرفهای این نرمافزار را به رایگان دریافت کنید. اگر قبلاً از Evernote استفاده میکردید، Notion یک ابزار مهاجرت ارائه میکند که همه چیز را به سادگی به نسخه جدید تبدیل خواهد کرد.
Grammarly
به دست آوردن نمره دقت بالا در یک مدل بسیار مطلوب است، اما یک پروژه علوم داده موفق شامل مقادیر بالایی از ارتباط با افراد مختلف در خصوص یافتهها و روشها است. گرامرلی یک دستیار اصلاح گرامر، لحن و سبک نوشتار با قابلیتهای هوش مصنوعی است که امکان بهبود مهارتهای نگارشی را به شما میدهد.
Notion به زودی گرامرلی را به صورت یک اپلیکیشن مستقل در خود ارائه خواهد کرد. در حال حاضر، گرامرلی تنها زمانی کار میکند که Notion را از طریق یک مرورگر باز کرده باشید.
سخن پایانی
امیدواریم مطالعه این مقاله با عنوان ابزارهای نرمافزاری ضروری برای پروژههای علوم داده برای شما مفید بوده و کمک کند تا پروژه علوم داده خود را با موفقیت استارت بزنید.