داده کاوی، هوش مصنوعی ۱۵۸۸ بازدید

یکی از مسائل مهم در زمینه «یادگیری ماشین» (Machine Learning) بهره‌گیری از ابزارهای مناسب است. «زبان برنامه‌نویسی پایتون» (Python Programming Language) به دلیل ویژگی‌های متعددی که دارد و همچنین، بهره‌گیری از کتابخانه‌های قدرتمند محاسبات علمی، یادگیری ماشین و «علم داده» (Data Science) توسط بسیاری (اگر نگوییم همه) از فعالان حوزه یادگیری ماشین مورد استفاده قرار می‌گیرد. راه‌اندازی محیط پایتون برای یادگیری ماشین، کاری نیازمند آشنایی با نکات و ترفندهای این حوزه است. افرادی که تاکنون چنین کاری را انجام نداده‌اند، ممکن است ساعت‌ها زمان برای سر و کله زدن با دستورات گوناگون و تلاش برای به نتیجه رسیدن نیاز داشته باشند. در این راهنما، چگونگی راه‌اندازی «محیط توسعه» (Development Environment) برای «یادگیری ماشین» (Machine Learning) با پایتون به صورت پایدار، آموزش داده شده است. افراد با بهره‌گیری از این راهنمای پایتون برای یادگیری ماشین می‌توانند به سرعت محیط توسعه خود را راه‌اندازی کنند و بدون نگرانی پیرامون نصب بسته‌های گوناگون، به کار یادگیری ماشین خود بپردازند.

۱. راه‌اندازی پایتون ۳ و pip

در راستای راه‌اندازی محیط پایتون برای یادگیری ماشین، اولین گام نصب pip است. pip یک مدیر بسته برای پایتون محسوب می‌شود.

sudo apt-get install python3-pip

با استفاده از pip، می‌توان هر بسته پایتونی که در Python Package Index (+) اندیس‌گذاری شده باشد را به سادگی با بهره‌گیری از دستور pip install your_package نصب کرد. در بخش دیگری از همین مطلب، چگونگی استفاده از این دستور در محیط مجازی نیز بیان خواهد شد. در ادامه، پایتون ۳ به عنوان نسخه پایتون پیش‌فرض تنظیم می‌شود و در صورت استفاده از هر یک از دستورهای pip یا python از خط فرمان، این نسخه از پایتون به کار گرفته می‌شود. این امر موجب می‌شود تا استفاده از پایتون ۳ ساده‌تر و راحت‌تر باشد. اگر این کار انجام نشود، هر بار که کاربری قصد استفاده از پایتون ۳ را داشته باشد، باید دستور خود را به صورت pip3 یا python3 وارد کند. برای تنظیم Python 3 به عنوان نسخه پیش‌فرض، فایل bashrc./~ باید ویرایش شود. در این راستا باید از خط فرمان دستور زیر را برای نمایش فایل bashrc اجرا کرد.

nano ~/.bashrc

در فایل موجود، باید به سمت انتهای فایل پیمایش کرد تا به قسمتی رسید که نوشته some more ls aliases # موجود است. سپس، خط زیر را به آن قسمت از فایل اضافه کرد.

alias python='python3'

اکنون، باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.

source ~/.bashrc

پس از انجام اعمال بالا، پایتون ۳، نسخه پیش‌فرض پایتون در سیستم کاربر محسوب می‌شود. اکنون می‌توان آن را با اجرای دستور python your_program در خط فرمان اجرا کرد.

2. ساخت محیط مجازی

در ادامه، محیط مجازی راه‌اندازی خواهد شد. در این محیط مجازی همه بسته‌های پایتونی که برای یادگیری ماشین مورد نیاز است نصب می‌شوند. به این دلیل از محیط مجازی استفاده می‌شود که کارهای راه‌اندازی کد مجزا شوند. حالتی مفروض است که کاربر بخواهد دو پروژه متفاوت را روی کامپیوتر خود انجام دهد. این امر نیازمند کتابخانه‌های گوناگون در نسخه‌های متفاوت است. داشتن همه آن‌ها در یک محیط کاری می‌تواند کاری بی‌نظم باشد و ممکن است به دلیل عدم سازگاری نسخه‌های مختلف یک محیط کاری مشکلاتی ایجاد می‌شوند. برای مثال، کد یادگیری ماشین برای پروژه ۱ نیاز به نسخه ۱.۰ کتابخانه «نام‌پای» (numpy) دارد و پروژه ۲ نیاز به نسخه ۱.۱۵. محیط مجازی این امکان را فراهم می‌کند که ناحیه‌های کاری به منظور جلوگیری از ایجاد مغایرت، نسبت به یکدیگر ایزوله شوند. در این راستا، ابتدا باید بسته‌های مرتبط را نصب کرد.

sudo pip install virtualenv virtualenvwrapper

پس از آنکه virtualenv و virtualenvwrapper نصب شدند، دوباره نیاز به ویرایش فایل bashrc./‍~ است. در این راستا، باید سه خط کد زیر را در پایین فایل قرار داد و فایل را ذخیره کرد.

export WORKON_HOME=$HOME/.virtualenvs
export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python3
source /usr/local/bin/virtualenvwrapper.sh

در ادامه باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.

source ~/.bashrc

در نهایت می‌توان محیط مجازی را ساخت.

mkvirtualenv ml

اکنون یک محیط مجازی ساخته شده که ml نامیده می‌شود. برای ورود به آن، از دستور زیر استفاده می‌شود.

workon ml

هر نصب کتابخانه‌ای مادامی که در محیط مجازی ml انجام شود در همانجا ایزوله خواهد شد و هرگز با دیگر محیط‌ها مغایرت نخواهد داشت. بنابراین، هنگامی که کاربر قصد اجرای کدی را دارد که وابسته به کتابخانه‌های موجود در محیط ml است، ابتدا با دستور workon به آن ورود و سپس، کد خود را به صورت نرمال اجرا کند. افرادی که قصد نصب virtualenv را دارند، می‌توانند از دستور زیر استفاده کنند.

deactivate

3. نصب کتابخانه‌های پایتون برای یادگیری ماشین

اکنون می‌توان کتابخانه‌های یادگیری ماشین را نصب کرد. متداول‌ترین کتابخانه‌های پایتون برای یادگیری ماشین و علم داده در زیر بیان شده‌اند. در این قسمت، نحوه نصب این موارد بیان می‌شود.

در ادامه با بهره‌گیری از یک راهکار ساده، نصب کلیه کتابخانه‌های بیان شده طی یک حرکت انجام می‌شود. بدین منظور، ابتدا باید فایل requirements.txt را ساخت و همه بسته‌هایی که قصد نصب آن‌ها وجود دارد را لیست کرد.

numpy
scipy
pandas
matplotlib
scikit-learn

پس از انجام این کار، تنها کافی است دستور زیر اجرا شود.

pip install -r requirements.txt

Pip از روی لیست جلو می‌رود و کتابخانه‌های موجود در فایل را نصب می‌کند. بدین شکل با استفاده از تنها یک دستور، کل کتابخانه‌های مورد نظر کاربر نصب می‌شوند. بسیار عالی، در حال حاضر محیط کاری کاربر آماده است و می‌تواند از آن برای کارهای یادگیری ماشین خود استفاده کند.

اگر نوشته بالا برای شما مفید بود، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۴ نفر
آیا این مطلب برای شما مفید بود؟
شما قبلا رای داده‌اید!
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.