راه اندازی محیط پایتون برای یادگیری ماشین – راهنمای کاربردی


یکی از مسائل مهم در زمینه «یادگیری ماشین» (Machine Learning) بهرهگیری از ابزارهای مناسب است. «زبان برنامهنویسی پایتون» (Python Programming Language) به دلیل ویژگیهای متعددی که دارد و همچنین، بهرهگیری از کتابخانههای قدرتمند محاسبات علمی، یادگیری ماشین و «علم داده» (Data Science) توسط بسیاری (اگر نگوییم همه) از فعالان حوزه یادگیری ماشین مورد استفاده قرار میگیرد. راهاندازی محیط پایتون برای یادگیری ماشین، کاری نیازمند آشنایی با نکات و ترفندهای این حوزه است. افرادی که تاکنون چنین کاری را انجام ندادهاند، ممکن است ساعتها زمان برای سر و کله زدن با دستورات گوناگون و تلاش برای به نتیجه رسیدن نیاز داشته باشند. در این راهنما، چگونگی راهاندازی «محیط توسعه» (Development Environment) برای «یادگیری ماشین» (Machine Learning) با پایتون به صورت پایدار، آموزش داده شده است. افراد با بهرهگیری از این راهنمای پایتون برای یادگیری ماشین میتوانند به سرعت محیط توسعه خود را راهاندازی کنند و بدون نگرانی پیرامون نصب بستههای گوناگون، به کار یادگیری ماشین خود بپردازند.
۱. راهاندازی پایتون ۳ و pip
در راستای راهاندازی محیط پایتون برای یادگیری ماشین، اولین گام نصب pip است. pip یک مدیر بسته برای پایتون محسوب میشود.
با استفاده از pip، میتوان هر بسته پایتونی که در Python Package Index (+) اندیسگذاری شده باشد را به سادگی با بهرهگیری از دستور pip install your_package نصب کرد.
در بخش دیگری از همین مطلب، چگونگی استفاده از این دستور در محیط مجازی نیز بیان خواهد شد. در ادامه، پایتون ۳ به عنوان نسخه پایتون پیشفرض تنظیم میشود و در صورت استفاده از هر یک از دستورهای pip یا python از خط فرمان، این نسخه از پایتون به کار گرفته میشود. این امر موجب میشود تا استفاده از پایتون ۳ سادهتر و راحتتر باشد. اگر این کار انجام نشود، هر بار که کاربری قصد استفاده از پایتون ۳ را داشته باشد، باید دستور خود را به صورت pip3 یا python3 وارد کند. برای تنظیم Python 3 به عنوان نسخه پیشفرض، فایل bashrc./~ باید ویرایش شود. در این راستا باید از خط فرمان دستور زیر را برای نمایش فایل bashrc اجرا کرد.
در فایل موجود، باید به سمت انتهای فایل پیمایش کرد تا به قسمتی رسید که نوشته some more ls aliases # موجود است. سپس، خط زیر را به آن قسمت از فایل اضافه کرد.
اکنون، باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.
پس از انجام اعمال بالا، پایتون ۳، نسخه پیشفرض پایتون در سیستم کاربر محسوب میشود. اکنون میتوان آن را با اجرای دستور python your_program در خط فرمان اجرا کرد.
2. ساخت محیط مجازی
در ادامه، محیط مجازی راهاندازی خواهد شد. در این محیط مجازی همه بستههای پایتونی که برای یادگیری ماشین مورد نیاز است نصب میشوند. به این دلیل از محیط مجازی استفاده میشود که کارهای راهاندازی کد مجزا شوند. حالتی مفروض است که کاربر بخواهد دو پروژه متفاوت را روی کامپیوتر خود انجام دهد.
این امر نیازمند کتابخانههای گوناگون در نسخههای متفاوت است. داشتن همه آنها در یک محیط کاری میتواند کاری بینظم باشد و ممکن است به دلیل عدم سازگاری نسخههای مختلف یک محیط کاری مشکلاتی ایجاد میشوند. برای مثال، کد یادگیری ماشین برای پروژه ۱ نیاز به نسخه ۱.۰ کتابخانه «نامپای» (numpy) دارد و پروژه ۲ نیاز به نسخه ۱.۱۵. محیط مجازی این امکان را فراهم میکند که ناحیههای کاری به منظور جلوگیری از ایجاد مغایرت، نسبت به یکدیگر ایزوله شوند. در این راستا، ابتدا باید بستههای مرتبط را نصب کرد.
پس از آنکه virtualenv و virtualenvwrapper نصب شدند، دوباره نیاز به ویرایش فایل bashrc./~ است. در این راستا، باید سه خط کد زیر را در پایین فایل قرار داد و فایل را ذخیره کرد.
در ادامه باید فایل را ذخیره و تغییرات را مجددا بارگذاری کرد.
در نهایت میتوان محیط مجازی را ساخت.
اکنون یک محیط مجازی ساخته شده که ml نامیده میشود. برای ورود به آن، از دستور زیر استفاده میشود.
هر نصب کتابخانهای مادامی که در محیط مجازی ml انجام شود در همانجا ایزوله خواهد شد و هرگز با دیگر محیطها مغایرت نخواهد داشت. بنابراین، هنگامی که کاربر قصد اجرای کدی را دارد که وابسته به کتابخانههای موجود در محیط ml است، ابتدا با دستور workon به آن ورود و سپس، کد خود را به صورت نرمال اجرا کند. افرادی که قصد نصب virtualenv را دارند، میتوانند از دستور زیر استفاده کنند.
3. نصب کتابخانههای پایتون برای یادگیری ماشین
اکنون میتوان کتابخانههای یادگیری ماشین را نصب کرد. متداولترین کتابخانههای پایتون برای یادگیری ماشین و علم داده در زیر بیان شدهاند. در این قسمت، نحوه نصب این موارد بیان میشود.
- «نامپای» «numpy» برای کار روی ماتریسها، به ویژه عملیات ریاضی
- «سایپای» «scipy» برای محاسبات علمی و فنی
- «پانداس» (pandas) برای مدیریت، دستکاری و تحلیل دادهها
- «متپلاتلیب» (matplotlib) برای بصریسازی دادهها
- «سایکیت لِرن» (scikit learn) برای یادگیری ماشین
در ادامه با بهرهگیری از یک راهکار ساده، نصب کلیه کتابخانههای بیان شده طی یک حرکت انجام میشود. بدین منظور، ابتدا باید فایل requirements.txt را ساخت و همه بستههایی که قصد نصب آنها وجود دارد را لیست کرد.
پس از انجام این کار، تنها کافی است دستور زیر اجرا شود.
Pip از روی لیست جلو میرود و کتابخانههای موجود در فایل را نصب میکند. بدین شکل با استفاده از تنها یک دستور، کل کتابخانههای مورد نظر کاربر نصب میشوند. بسیار عالی، در حال حاضر محیط کاری کاربر آماده است و میتواند از آن برای کارهای یادگیری ماشین خود استفاده کند.
اگر نوشته بالا برای شما مفید بود، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- آموزش یادگیری ماشین (Machine Learning) با پایتون (Python)
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش یادگیری ماشین با مثالهای کاربردی — مجموعه مقالات جامع وبلاگ فرادرس
- یادگیری عمیق (Deep Learning) با پایتون — به زبان ساده
- دادهکاوی (Data Mining) — از صفر تا صد
- بهترین IDE برای پایتون — معرفی و مقایسه محیط های توسعه پایتون
^^