کار با فایل های اکسل در پایتون – راهنمای مقدماتی
کار با پایتون در اغلب موارد به تنهایی خود یک نعمت محسوب میشود. افرادی که مدت زمان زیادی با پایتون کار کردهاند، غالباً اظهار میکنند که در کار با آن هیچ مشکلی ندارد، اما شاید آنها مجبور به کار با «صفحههای گسترده» (اسپردشیت) و فایل های اکسل در پایتون نشدهاند. پایتون ساختار آسانی برای نوشتن دارد و سبک دینامیک آن موجب شده که به گزینهای عالی برای مبتدیان تبدیل شود. اما مزیتهای آن به اینجا ختم نمیشود. پایتون میتواند در بسیاری از محصولات بزرگ مانند فریمورک Django استفاده شود و استفاده هم میشود.
جنگو قدرت برخی اپلیکیشنهای رسانهای مانند اینستاگرام را تأمین میکند. نمونههای دیگر شامل BitTorrent ،Google App Engine و Ubuntu Software Center هستند. حتی کارکردهای مرکزی یوتیوب نیز در پایتون نوشته شدهاند. همه این مثالها پایداری و مفید بودن پایتون را نشان میدهند.
کار با داده و فایل های اکسل در پایتون
پایتون یک زبان اسکریپتنویسی عالی است و توسعهدهندگان ترجیح میدهند از آن در مواردی استفاده کنند که قرار است با داده سروکار داشته باشند و آنها را دستکاری کنند. به طور خاص پایتون در مواردی مفید است که قرار است در یک پروژه دادههایی از محصولات گردآوری شده و به مشتریان گزارشدهی شود.
این کار نیازمند واکشی دادهها از پایگاه داده و دستکاری آنها به صورت یک فرم قابل ارائه است که به صورت کلی قالب «صفحه گسترده» است. در این نوشته به بررسی روش انجام این کار میپردازیم.
نکاتی که در این نوشته مطرح میشوند مختص افرادی هستند که با دادههای زیادی سروکار دارند و میخواهند آنها را در قالب صفحه گسترده یا اسپردشیت ارائه کنند. در مسیر انجام این کار چند مشکل وجود دارد که برخی از آنها را در اینجا مطرح میکنیم و روشهای رفع آنها را نیز توضیح میدهیم.
پکیجهای شخص ثالث زیادی برای کار با اسپردشیتها در پایتون وجود دارند. برخی از آنها شامل فهرست زیر هستند:
شاید اطلاع داشته باشید که اکسل دو پسوند فایل برای صفحههای گسترده ارائه کرده است که یکی xls. و دیگری xlsx. است. اولی برای فایلهایی با قالب مایکروسافت اکسل 2003 و قبلتر است و دومی برای نسخههای جدیدتر استفاده میشود.
نخستین مشکلی که در زمان کار کردن با صفحههای گسترده در پایتون پیش میآید این است که دو پسوند فایل مختلف وجود دارند. پکیج xlwt از پسوند xls. برای فایلهای اکسل پشتیبانی میکند و openpyxl نیز از پسوند xlsx. برای فایلهای اکسل پشتیبانی میکند.
پکیج xlwt
در ادامه شیوه استفاده از پکیج xlwt را برای کار کردن با صفحههای گسترده توضیح میدهیم. شما میتوانید این پکیج را با اجرای دستور زیر روی ترمینال یا اعلان فرمان، نصب کنید:
pip install xlwt
توجه کنید که باید pip روی سیستم شما نصب باشد. برای نصب pip از دستورالعملهای این مطلب استفاده کنید:
در این مطلب از xlwt نسخه 1.3.0 استفاده شده است. پس از این که کار نصب پکیج کامل شد یک ویرایشگر متنی باز کنید و یک فایل جدید ایجاد کرده و نامی که دوست دارید را به آن بدهید. ما نام فایل خود را excelScript.py گذاردهایم.
درون این اسکریپت کد زیر را بنویسید:
کد فوق یک فایل اکسل خالی با نام Sample.xls ایجاد میکند که شامل یک برگه منفرد با عنوان Sheet 1 است. این برگه نمونهای از ایجاد فایل ساده xls. است. اسکریپت فوق را میتوانید به صورت زیر در خط فرمان اجرا کنید:
python excelScript.py
برای نوشتن دادهها در برگه اکسل، کد را به صورت زیر تغییر دهید:
بدین ترتیب عبارت sample در ردیف صفر و ستون صفر نوشته میشود. به خاطر بسپارید که پکیج xlwt اندیسهای ردیفها و ستونها را از صفر آغاز میکند. بدین ترتیب میتوانیم هر تعداد برگه که میخواهید در فایلهای اکسل بنویسید. این اسکریپت را با استفاده از دستور زیر در خط فرمان اجرا کنید:
python excelScript.py
این یک روش رایج برای نوشتن اکسل با استفاده از پکیج xlwt است که در آن میتوانید ستونها و ردیفها را ادغام کنید. شما میتوانید استایل نیز تعیین کنید. کد زیر روش انجام این کار را نشان میدهد:
بدین ترتیب ستونهای (0,1) و ردیفهای (0,1) ادغام میشوند تا یک ستون منفرد تشکیل دهند و sample 1 در آن نوشته میشود که در جهات افقی و عمودی به صوت مرکزی همراستا شده است. xlwt.easyxf کار استایل دادن را برای شما انجام میدهد. اگر فایل xls را باز کنید، نمونه قبلاً نوشته شده را میبینید. برای کسب اطلاعات بیشتر در مورد متدهای ارائه شده از سوی پکیج xlwt میتوانید به صفحه مستندات آن (+) مراجعه کنید.
توجه داشته باشید که اگر از xlwt استفاده کنید و فایلی با همان نام وجود داشته باشد در این صورت فایل جایگزین خواهد شد. رویه فوق محدودیتهایی نیز دارد، زیرا میتوانید تنها 65536 ردیف و 256 ستون در نسخههای قدیمی اکسل ایجاد کنید. به طور مشابه در زمان استفاده از این پکیج نیز تنها میتوانید این تعداد ردیف و ستون ایجاد کنید. اگر میخواهید دادههای بیشتر از این مقدار بنویسید، در این صورت متأسفانه این پکیج نمیتواند به شما کمک کند و باید از پکیج پایتون دیگری به نام openpyxl (+) استفاده کنید.
در زمان کار با پکیج xlwt متوجه شدیم که ایجاد فایلهای xls. بسیار آسان است، اما اگر از قبل یک فایل xls. داشته باشیم و بخواهیم دادههای جدیدی به فایل موجود الحاق کنیم چطور؟ در چنین حالتی پکیج xlwt مناسب نخواهد بود و باید این مشکل را رفع کنیم. توجه داشته باشید که اگر یک فایل xls. داشته باشید در این صورت نمیتوانید از openpyxl استفاده کنید که از الحاق دادهها به فایلهای موجود پشتیبانی میکند، زیرا این پکیج با نسخههای قدیمی فایلهای اکسل ناسازگار است.
برای حل این مشکل به دو پکیج دیگر پایتون نیاز داریم. برای نمونه پکیج xlrd برای خواندن فایل اکسل و پکیج xlutils برای ایجاد یک کپی از شیء اکسل درون شیء xlwt است به طوری که بتوان درون آن چیزی نوشت. برای نصب این پکیجها دستورهای زیر را اجرا کنید:
pip install xlrd pip install xlutils
برای الحاق دادهها به یک فایل موجود xls. با استفاده از xlwt، رویه زیر میتواند مورد استفاده قرار گیرد. در فایل excelScript.py، کد را به صورت زیر تغییر دهید:
زمانی که این اسکریپت را با استفاده از دستور زیر اجرا کنید:
python excelScript.py
و فایل اکسل ایجاد شده را باز کنید، متوجه خواهید شد که sample 1 در فایل xls. موجود قبلی نوشته شده است و sample 2 و sample 3 نیز به آن فایل اضافه شده است. این همان کارکردی است که به آن نیاز داریم. در ادامه روش اجرای آن را توضیح میدهیم.
سیر وقایعی که اتفاق میافتند به صورت زیر است. ابتدا فایل با استفاده از پکیج xlrd خوانده میشود و در یک متغیر به نام rb در قالب یک شیء ذخیره میشود. سپس این شیء با استفاده از متد copy در پکیج xlutils درون یک متغیر wb کپی میشود. این بدان معنی است که در بازهای از زمان هر دو متغیر rb و wb حاوی دادههای شیء یکسانی خواهند بود. اکنون با استفاده از اندیس صفر به برگه نخست اکسل دسترسی داریم و دادههای شیء آن را درون متغیر sheet ذخیره میکنیم. همچنین در این زمان میتوانیم از همه ظرفیتهای کارکردی پکیج xlwt برای ذخیره نهایی برگه اکسل با همان نام قبلی یعنی sample.xls استفاده کنیم.
اگر مطالب فوق را به دقت پیگیری کرده باشید، در این صورت احتمالاً متوجه شدهاید که دادهها در عمل واقعاً به فایل موجود الحاق نشدهاند. در واقع کاری که ما انجام دادیم این است که دادههای فایل موجود را با استفاده از xlrd درون حافظه کپی کردهایم، پس آنها را با استفاده از متد copy از پکیج xlutiles درون فایل اکسل جدیدی نوشتهایم و در نهایت دادههای جدید را در فایل جدید اکسل نوشتهایم و آن را با همان نام قبلی ذخیره کردهایم تا روی فایل قبلی بازنویسی شود.
پکیج openpyxl
در صورتی که با فایلهای قدیمی xls. کار میکنید، شاید این روش چندان مناسب نباشد و قضیه به همین جا ختم نمیشود. همه این موارد که طرح شد به کار با فایلهای xls. مربوط میشوند، اما گر بخواهیم همین کار را روی فایلهای xlsx. انجام دهیم باید از پکیج openpyxl استفاده کنیم.
در ادامه به بررسی استفاده از پکیج پایتون openpyxl برای ایجاد صفحههای گسترده در قالب xlsx. میپردازیم. چنان که پیشتر گفتیم، اگر دادههای زیادی در فایل خود داشته باشید و مشتریهای زیادی وجود داشته باشند که قرار باشد به همه آنها گزارش دهیم در این صورت دانستن روش کار با قالبهای xls. و xlsx. به عنوان قالبهای قدیمی و جدید ذخیره فایل اکسل مهارت مناسبی است که در اغلب موارد به کار شما میآید.
پکیج openpyxl (+) یک کتابخانه پایتون برای خواندن و نوشتن فایلهای xlsx/xlsm/xltx/xltm است.
بدین ترتیب تنها با استفاده از یک پکیج میتوان دادهها را خواند، نوشت و الحاق کرد. این پکیج را میتوان با استفاده از دستور زیر در ترمینال یا اعلان فرمان نصب کرد:
pip install openpyxl
توجه کنید که pip باید روی سیستم نصب باشد. پس از این که نصب پکیج پایان یافت، ویرایشگر متنی را باز کنید تا یک فایل جدید ایجاد کنید و نامی که دوست دارید را روی آن بگذارید. ما فایل خود را excelScript.py نامیدیم. درون اسکریپت کد زیر را بنویسید:
کد فوق یک فایل اکسل خالی به نام Sample.xlsx ایجاد میکند که شامل یک برگه منفرد به نام sheet 1 است. این برگه نمونهای از فرایند ایجاد یک فایل xslx. است. اسکریپت زیر را با وارد کردن دستور زیر در خط فرمان اجرا کنید:
python excelScript.py
زمانی که این فایل xlsx. را باز کنید، میبینید که به جای یک برگه، دو برگه در فایل ایجاد شده است. دلیل رخ دادن این وضعیت آن است که در زمان ایجاد یک شیء با متد ()Workbook در پکیج openpyxl، این متد به طور پیشفرض به محض فراخوانی یک برگه به نام sheet ایجاد میکند.
اگر نامهای برگهای که روی آن کار میکنید، برایتان مهم نیست میتوانید مستقیماً روی همین برگه کار کنید و نیازی به ایجاد برگه دیگر وجود ندارد. اگر کارتان طوری است که باید حتماً از یک برگه استفاده کنید، میتوانید مستقیماً شروع به نوشتن در این برگه بکنید. در ادامه شیوه حذف برگه پیشفرض Sheet از فایل xlsx. را آموزش خواهیم داد. برای نوشتن دادهها در اکسل کد را به صورت زیر تغییر دهید:
کد فوق عبارت sample را در ردیف اول و ستون اول وارد میکند. به خاطر داشته باشید که پکیج openpyxl اندیسهای ردیف و ستون را با شروع از یک میخواند. بدین ترتیب میتوانید در فایل اکسل بنویسید و هر تعداد برگه که دوست دارید ایجاد کنید. اسکریپت فوق را با وارد کردن دستور زیر در خط فرمان اجرا کنید:
python excelScript.py
همچنین میتوانید به آن استایل نیز بدهید. کد زیر روش انجام این کار را به شما نشان میدهد:
بدین ترتیب عبارت sample در ردیف اول و ستون اول درج میشود. این سلول از جهات افقی و عمودی به صورت مرکرگزا همراستا شده است. برای کسب اطلاعات بیشتر در مورد متدهای ارائه شده از سوی پکیج openpyxl به مستندات آن (+) مراجعه کنید.
همچنین همانند کاری که با استفاده از xlwt انجام دادیم، میتوانید با استفاده از openpyxl نیز سلولها را در هم ادغام کنید. کد زیر روش ادغام سلولها را با استفاده از openpyxl نشان میدهد:
کد فوق شیوه ادغام سلولها را هنگامی نشان میدهد که نام سلولهایی که باید ادغام شوند را به طور کامل میدانید. مثلاً در کد فوق میدانستیم که نام سلول ستون اول و ردیف اول A1 و نام سلول ستون سوم و ردیف اول C1 است. در این حالت آنها را مستقیماً با استفاده از متد merge_cells در پکیج openpyxl ادغام میکنیم. این یکی از دو متدی است که در openpyxl برای ادغام سلولها استفاده میشود. متد دوم نیز به صورت زیر عمل میکند:
این متد زمانی به کار میآید که دادهها به صورت دینامیک در فایل اکسل نوشته شده باشند. اگر مطمئن نیستید که نام دقیق سلولهایی که قرار است ادغام شوند چه هستند، در این صورت میتوانید از این متد استفاده کنید. این متد سه ستون اول از سه ردیف اول را در یک سلول منفرد ادغام میکند.
زمانی که سلولها را ادغام میکنید، همواره به خاطر داشته باشید که باید مقدار را درون ستون اول سلول ادغام شده وارد کنید، چون در غیر این صورت مقدار مورد نظر از فایل اکسل حذف میشود. شما میتوانید استایل سلول ادغام شده را به طرز مشابهی که قبلاً نشان دادیم اعمال کنید. اکنون نوبت به بررسی روش حذف برگه اضافی میرسد که به طور پیشفرض با فراخوانی متد ()Workbook کتابخانه openpyxl ایجاد شده است. روش انجام کار به صورت زیر است:
در این کد ما برگهای با نام Sheet را با استفاده از متد ()get_sheet_by_name در یک شیء قرار میدهیم و سپس آن را در متغیر extraSheet ذخیره کرده و در نهایت برگه را با استفاده از فراخوانی متد ()remove_sheet روی متغیر extraSheet حذف میکنیم. بدین ترتیب با مراحل ایجاد یک فایل جدید xlxs.، نوشتن آن، ادغام سلولها و استایلدهی آن آشنا شدیم. اکنون به بررسی روش خواندن و الحاق دادهها در فایل xlsx. با استفاده از پکیج openpyxl میپردازیم.
قبل از هر چیز روش خواندن فایل xlsx. را با استفاده از openpyxl بررسی میکنیم. همانند روش نوشتن میتوان از ()openpyxl.load_workbook برای باز کردن یک ورکبوک موجود استفاده کرد:
کد فوق همه سلولهای نوشته شده در فایل اکسل را نمایش میدهد. حلقه for به جای 0 از 1 آغاز میشود چون openpyxl اندیسگذاری را از 1 آغاز میکند. همچنین میتوان سلولها را با استفاده از نام سلولها نیز خواند:
ما [cells[0 را انتخاب کردیم، زیرا ['sheet['A1:C1 یک چندتایی از چندتاییها ایجاد میکند و همه اشیای سلول در اندیس 0-ام چندتایی ذخیره شدهاند، لذا [cells[0 را میخوانیم. در نهایت با روش الحاق دادهها به فایل xlsx. آشنا میشویم. کد زیر فرایند این کار را نشان میدهد:
در واقع فرایند کار بسیار آسان است. کافی است فایل xlsx. موجود را درون یک شیء بارگذاری کنید و آن را با فراخوانی متد روی فایل Sample.xlsx در متغیر book ذخیره کنید. سپس برگه sample را با فراخوانی متد ()get_sheet_by_name روی شیء book به دست میآوریم.
اکنون میتوانیم همانند روش ایجاد یک فایل جدید، به سادگی شروع به الحاق دادهها روی برگه بکنیم. همه آن متدهایی که در زمان ایجاد فایل در اختیار ما بودند، هم اینک نیز موجود هستند. در نهایت زمانی که کار نوشتن دادهها در فایل را انجام دادیم، نباید فراموش کنیم که فایل را با فراخوانی متد ()save ذخیره کنیم.
به علاوه فراموش نکنید که در زمان کدنویسی از کدهای زیباتری استفاده کنید و استانداردهای PEP8 را رعایت کنید تا کد شما خواناتر باشد. پیش از عرضه کد خود از PyLint استفاده کنید. بدین ترتیب میتوانید یک استاندارد کدنویسی در پروژه خود نگهداری کنید.
سخن پایانی
در این نوشته به معرفی روشهای مختلف کار با فایلهای صفحه گسترده در پایتون پرداختیم، اما کار به همین جا ختم نمیشود. اینها تنها مبانی مقدماتی روش خواندن، نوشتن و الحاق دادهها در فایلهای xls. و xlsx. بودند. شما باید این پکیجها را مورد بررسی بیشتر قرار دهید و بر اساس الزامات خود بسته به حالتی که دادهها را در فایلهای اکسل نمایش میدهید، الگوریتمهای خاص خود را بنویسید.
اگر این مطلب برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای برنامهنویسی پایتون Python
- مجموعه آموزشهای برنامهنویسی
- گنجینه آموزش های برنامه نویسی پایتون (Python)
- زبان برنامه نویسی پایتون (Python) — از صفر تا صد
- آموزش پایتون با ساخت اپلیکیشنهای واقعی — مجموعه مقالات مجله فرادرس
==