راه اندازی محیط پایتون برای یادگیری ماشین — راهنمای کاربردی
یکی از مسائل مهم در زمینه «یادگیری ماشین» (Machine Learning) بهرهگیری از ابزارهای مناسب است. «زبان برنامهنویسی پایتون» (Python Programming Language) به دلیل ویژگیهای متعددی که دارد و همچنین، بهرهگیری از کتابخانههای قدرتمند محاسبات علمی، یادگیری ماشین و «علم داده» (Data Science) توسط بسیاری (اگر نگوییم همه) از فعالان حوزه یادگیری ماشین مورد استفاده قرار میگیرد. راهاندازی محیط پایتون برای یادگیری ماشین، کاری نیازمند آشنایی با نکات و ترفندهای این حوزه است. افرادی که تاکنون چنین کاری را انجام ندادهاند، ممکن است ساعتها زمان برای سر و کله زدن با دستورات گوناگون و تلاش برای به نتیجه رسیدن نیاز داشته باشند. در این راهنما، چگونگی راهاندازی «محیط توسعه» (Development Environment) برای «یادگیری ماشین» (Machine Learning) با پایتون به صورت پایدار، آموزش داده شده است. افراد با بهرهگیری از این راهنمای پایتون برای یادگیری ماشین میتوانند به سرعت محیط توسعه خود را راهاندازی کنند و بدون نگرانی پیرامون نصب بستههای گوناگون، به کار یادگیری ماشین خود بپردازند.
۱. راهاندازی پایتون ۳ و pip
در راستای راهاندازی محیط پایتون برای یادگیری ماشین، اولین گام نصب pip است. pip یک مدیر بسته برای پایتون محسوب میشود.
1sudo apt-get install python3-pip
با استفاده از pip، میتوان هر بسته پایتونی که در Python Package Index (+) اندیسگذاری شده باشد را به سادگی با بهرهگیری از دستور pip install your_package نصب کرد.
در بخش دیگری از همین مطلب، چگونگی استفاده از این دستور در محیط مجازی نیز بیان خواهد شد. در ادامه، پایتون ۳ به عنوان نسخه پایتون پیشفرض تنظیم میشود و در صورت استفاده از هر یک از دستورهای pip یا python از خط فرمان، این نسخه از پایتون به کار گرفته میشود. این امر موجب میشود تا استفاده از پایتون ۳ سادهتر و راحتتر باشد. اگر این کار انجام نشود، هر بار که کاربری قصد استفاده از پایتون ۳ را داشته باشد، باید دستور خود را به صورت pip3 یا python3 وارد کند. برای تنظیم Python 3 به عنوان نسخه پیشفرض، فایل bashrc./~ باید ویرایش شود. در این راستا باید از خط فرمان دستور زیر را برای نمایش فایل bashrc اجرا کرد.
1nano ~/.bashrc
در فایل موجود، باید به سمت انتهای فایل پیمایش کرد تا به قسمتی رسید که نوشته some more ls aliases # موجود است. سپس، خط زیر را به آن قسمت از فایل اضافه کرد.
1alias python='python3'
اکنون، باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.
1source ~/.bashrc
پس از انجام اعمال بالا، پایتون ۳، نسخه پیشفرض پایتون در سیستم کاربر محسوب میشود. اکنون میتوان آن را با اجرای دستور python your_program در خط فرمان اجرا کرد.
2. ساخت محیط مجازی
در ادامه، محیط مجازی راهاندازی خواهد شد. در این محیط مجازی همه بستههای پایتونی که برای یادگیری ماشین مورد نیاز است نصب میشوند. به این دلیل از محیط مجازی استفاده میشود که کارهای راهاندازی کد مجزا شوند. حالتی مفروض است که کاربر بخواهد دو پروژه متفاوت را روی کامپیوتر خود انجام دهد.
این امر نیازمند کتابخانههای گوناگون در نسخههای متفاوت است. داشتن همه آنها در یک محیط کاری میتواند کاری بینظم باشد و ممکن است به دلیل عدم سازگاری نسخههای مختلف یک محیط کاری مشکلاتی ایجاد میشوند. برای مثال، کد یادگیری ماشین برای پروژه ۱ نیاز به نسخه ۱.۰ کتابخانه «نامپای» (numpy) دارد و پروژه ۲ نیاز به نسخه ۱.۱۵. محیط مجازی این امکان را فراهم میکند که ناحیههای کاری به منظور جلوگیری از ایجاد مغایرت، نسبت به یکدیگر ایزوله شوند. در این راستا، ابتدا باید بستههای مرتبط را نصب کرد.
1sudo pip install virtualenv virtualenvwrapper
پس از آنکه virtualenv و virtualenvwrapper نصب شدند، دوباره نیاز به ویرایش فایل bashrc./~ است. در این راستا، باید سه خط کد زیر را در پایین فایل قرار داد و فایل را ذخیره کرد.
1export WORKON_HOME=$HOME/.virtualenvs
2export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python3
3source /usr/local/bin/virtualenvwrapper.sh
در ادامه باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.
1source ~/.bashrc
در نهایت میتوان محیط مجازی را ساخت.
1mkvirtualenv ml
اکنون یک محیط مجازی ساخته شده که ml نامیده میشود. برای ورود به آن، از دستور زیر استفاده میشود.
1workon ml
هر نصب کتابخانهای مادامی که در محیط مجازی ml انجام شود در همانجا ایزوله خواهد شد و هرگز با دیگر محیطها مغایرت نخواهد داشت. بنابراین، هنگامی که کاربر قصد اجرای کدی را دارد که وابسته به کتابخانههای موجود در محیط ml است، ابتدا با دستور workon به آن ورود و سپس، کد خود را به صورت نرمال اجرا کند. افرادی که قصد نصب virtualenv را دارند، میتوانند از دستور زیر استفاده کنند.
1deactivate
3. نصب کتابخانههای پایتون برای یادگیری ماشین
اکنون میتوان کتابخانههای یادگیری ماشین را نصب کرد. متداولترین کتابخانههای پایتون برای یادگیری ماشین و علم داده در زیر بیان شدهاند. در این قسمت، نحوه نصب این موارد بیان میشود.
- «نامپای» «numpy» برای کار روی ماتریسها، به ویژه عملیات ریاضی
- «سایپای» «scipy» برای محاسبات علمی و فنی
- «پانداس» (pandas) برای مدیریت، دستکاری و تحلیل دادهها
- «متپلاتلیب» (matplotlib) برای بصریسازی دادهها
- «سایکیت لِرن» (scikit learn) برای یادگیری ماشین
در ادامه با بهرهگیری از یک راهکار ساده، نصب کلیه کتابخانههای بیان شده طی یک حرکت انجام میشود. بدین منظور، ابتدا باید فایل requirements.txt را ساخت و همه بستههایی که قصد نصب آنها وجود دارد را لیست کرد.
1numpy
2scipy
3pandas
4matplotlib
5scikit-learn
پس از انجام این کار، تنها کافی است دستور زیر اجرا شود.
1pip install -r requirements.txt
Pip از روی لیست جلو میرود و کتابخانههای موجود در فایل را نصب میکند. بدین شکل با استفاده از تنها یک دستور، کل کتابخانههای مورد نظر کاربر نصب میشوند. بسیار عالی، در حال حاضر محیط کاری کاربر آماده است و میتواند از آن برای کارهای یادگیری ماشین خود استفاده کند.
اگر نوشته بالا برای شما مفید بود، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- آموزش یادگیری ماشین (Machine Learning) با پایتون (Python)
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش یادگیری ماشین با مثالهای کاربردی — مجموعه مقالات جامع وبلاگ فرادرس
- یادگیری عمیق (Deep Learning) با پایتون — به زبان ساده
- دادهکاوی (Data Mining) — از صفر تا صد
- بهترین IDE برای پایتون — معرفی و مقایسه محیط های توسعه پایتون
^^