کتابخانه NumPy پایتون – راهنمای جامع – بخش دوم

۲۱۶۸

۱۴۰۳/۰۹/۱۴

۱۱ دقیقه

PDF

آموزش متنی جامع

امکان دانلود نسخه PDF

در بخش اول این مقاله به معرفی برخی مباحث مقدماتی کتابخانه NumPy پرداختیم. در این بخش، سطح نسبتاً پیشرفته‌تری از آموزش NumPy ارائه می‌شود.

فهرست مطالب این نوشته

قواعد انتشار (Broadcasting)

اندیس‌گذاری زیبا و ترفندهای اندیس‌گذاری

اندیس‌گذاری با آرایه‌ها و اندیس‌ها

اندیس‌گذاری با استفاده از آرایه‌های بولی

تابع ()_ix

جبر خطی

عملیات‌های ساده بر روی آرایه

کلاس ماتریس

اندیس‌گذاری: مقایسه ماتریس‌ها و آرایه‌های دوبعدی

قواعد انتشار (Broadcasting)

قواعد انتشار به تابع‌های سراسری اجازه می‌دهد که به یک روش منطقی با ورودی‌ها کار کنند و لازم نیست که شکل یکسانی داشته باشند. قاعده نخست انتشار این است که اگر همه ورودی‌های آرایه ابعاد یکسانی نداشته باشند، یک «1» مکرراً به شکل‌های آرایه‌ای کوچک‌تر اضافه می‌شود تا جایی که آرایه مذکور به تعداد ابعاد مشابه برسد. قاعده دوم انتشار تضمین می‌کند که آرایه‌هایی که در یک بعد خاص، ابعادی به طول 1 دارند طوری عمل می‌کنند که گویی در آن بعد، اندازه‌ای بزرگ‌تر دارند. مقدار عنصر آرایه در آن بعد، برابر با مقدار عنصر در راستای همان بعد در آرایه «انتشار» در نظر گرفته می‌شود.

فیلم آموزش کتابخانه NumPy برای محاسبات علمی در پایتون (رایگان) در فرادرس

کلیک کنید

اندیس‌گذاری زیبا و ترفندهای اندیس‌گذاری

NumPy نسبت به دنباله‌های معمولی پایتون امکانات اندیس‌گذاری بیشتری دارد. علاوه بر امکان اندیس‌گذاری بر اساس اعداد صحیح و قطعه‌ها، که در بخش‌های قبلی دیدیم، آرایه‌ها می‌توانند به‌وسیله‌ی آرایه‌ای از اعداد صحیح و آرایه‌ای از مقادیر بولی اندیس‌گذاری شوند.

اندیس‌گذاری با آرایه‌ها و اندیس‌ها

زمانی که آرایه اندیس‌گذاری شده a چندبعدی باشد، منظور از یک آرایه منفرد از اندیس‌ها، در واقع بعد نخست a است. مثال زیر با تبدیل کردن یک تصویر از برچسب‌ها به یک تصویر رنگی با استفاده از یک پالت این رفتار را نشان می‌دهد.

همچنین می‌توان برای بیش از یک بعد اندیس‌هایی ارائه کرد. آرایه‌ی اندیس‌های هر بعد باید شکل یکسانی داشته باشند.

به طور طبیعی می‌توان i و j را در یک دنباله (مثلاً یک فهرست) قرار داد و سپس با استفاده از فهرست اندیس‌گذاری کرد.

ولی این کار را با قرار دادن i و j در یک آرایه نمی‌توان انجام داد، زیرا آرایه به عنوان اندیس‌گذاری بعد نخست a تفسیر می‌شود.

استفاده رایج دیگر از اندیس‌گذاری آرایه‌ها، جستجوی مقدار بیشینه سری‌های وابسته به زمان است:

همچنین می‌توان از اندیس‌گذاری آرایه‌ها به عنوان هدفی برای انتساب مقادیر به آن‌ها استفاده کرد:

بااین‌حال وقتی یک فهرست از اندیس‌ها شامل موارد تکراری باشد، این انتساب چند بار رخ می‌دهد و بخشی از مقادیر حذف می‌شوند:

منطق این کار مشخص است اما ابتدا بررسی کنید که آیا می‌خواهید از سازه =+ پایتون استفاده کنید یا نه، چون ممکن است آن چیزی نباشد که انتظار دارید:

با این‌که مقدار 0 دو بار در فهرست اندیس‌ها ظاهر شده است اما عنصر 0-ام تنها یک عنصر افزایش یافته است. این حالت به این دلیل رخ داده است که پایتون الزام می‌کند «a+=1» معادل «a=a+1» محاسبه شود.

اندیس‌گذاری با استفاده از آرایه‌های بولی

وقتی آرایه‌ها را با استفاده از آرایه‌هایی از اندیس‌ها (اعداد صحیح) اندیس‌گذاری می‌کنیم در واقع فهرستی از اندیس‌ها برای انتخاب کردن ارائه می‌دهیم. در مورد اندیس‌های بولی، رویکرد اندکی متفاوت است؛ در این روش ما صریحاً انتخاب می‌کنیم که در یک آرایه کدام اندیس‌ها را می‌خواهیم و کدام‌ را نمی‌خواهیم. طبیعی‌ترین روشی که ممکن است برای استفاده از اندیس‌گذاری بولی در ذهن داشته باشیم، داشتن آرایه‌های بولی است که همانند آرایه اصلی شکل یکسانی داشته باشند:

این خصوصیت می‌تواند در زمان انتساب مقادیر بسیار مفید باشد:

این روش دوم اندیس‌گذاری با عبارت‌های بولی به روش اندیس‌گذاری با اعداد صحیح شباهت بیشتری دارد، چون برای هر بعد آرایه، یک آرایه بولی 1 بعدی اختصاص می‌دهیم و تکه‌هایی که می‌خواهیم را از میان آن‌ها انتخاب می‌کنیم.

توجه کنید که طول آرایه بولی تک‌بعدی باید با طول ابعادی که می‌خواهیم قطعه‌بندی کنیم هماهنگ باشد.

تابع ()_ix

تابع ()_ix را می‌توان برای ترکیب بردارهای مختلف استفاده کرد به طوری که برای هر n-تایی یک آرایه به دست آورد. برای مثال اگر بخواهیم همه مقادیر a+b*c را برای همه چندتایی‌های به دست آمده از هر بردار a، b و c به دست آوریم، می‌توانیم از تابع ()_ix استفاده کنیم.

همچنین می‌توان از تابع reduce استفاده کرد:

و سپس از آن به‌صورت زیر استفاده کرد:

مزیت این نسخه از تابع reduce در مقایسه با نسخه معمولی ufanc.reduce این است که در آن از قواعد انتشار استفاده شده است تا از ایجاد یک آرایه‌ی آرگومان در خروجی که اندازه‌ای چند برابر بردارها دارد، اجتناب شود.

جبر خطی

عملیات‌های ساده بر روی آرایه

در ادامه برخی مثال‌ها برای آشنایی با عملیات‌های ساده جبر خطی بر روی آرایه‌ها ارائه شده‌اند که برای کاربری در سطح متوسط نیاز به توضیح چندانی ندارند:

کلاس ماتریس

در ادامه مقدمه مختصری در مورد کلاس ماتریس ارائه شده است.

اندیس‌گذاری: مقایسه ماتریس‌ها و آرایه‌های دوبعدی

توجه کنید که برخی تفاوت‌های مهم بین آرایه‌های NumPy و ماتریس‌ها وجود دارند. NumPy دو شی بنیادی را ارائه می‌کند: یک شی آرایه N بعدی و یک شی تابع سراسری. در NumPy اشیای دیگر بر روی این دو شی بنیادی ساخته می‌شوند. به طور خاص ماتریس‌ها اشیای آرایه‌ای دوبعدی هستند که از شی‌ء آرایه‌ای NumPy به ارث رسیده‌اند. در هر دو شی آرایه و ماتریس، اندیس‌ها باید ترکیبی صحیح از یک یا چند مورد زیر باشند:

اسکالرهای صحیح
سه‌نقطه (...)
فهرستی از مقادیر صحیح یا بولی
یک چندتایی از مقادیر صحیح یا بولی
یک آرایه 1 بعدی از مقادیر صحیح یا بولی

از یک ماتریس می‌توان به عنوان اندیسی برای ماتریس‌ها استفاده کرد، اما معمولاً آن را برای انجام یک کار مفروض بر روی یک آرایه، فهرست یا دیگر اشکال، نیاز خواهیم داشت. آرایه‌ها در NumPy نیز همانند پایتون از صفر شروع می‌شوند. به طور سنتی یک آرایه 2 بعدی یا ماتریس به‌صورت یک آرایه مستطیلی از ردیف‌ها و ستون‌ها نمایش می‌یابد که حرکت در راستای محور 0 در واقع حرکت در راستای ردیف‌ها و حرکت در راستای محور 1، حرکت در راستای ستون‌ها محسوب می‌شود.

در ادامه یک آرایه و یک ماتریس ایجاد می‌کنیم و آن را قطعه‌بندی می‌کنیم:

اینک در مورد برخی قطعه‌بندی‌های ساده صحبت می‌کنیم. قطعه‌بندی ساده به قطعه‌بندی اشیا یا اعداد صحیح گفته می‌شود. برای مثال، ارزیابی [:]A و M[:] نمونه‌های آشنایی از قطعه‌بندی اندیس‌گذاری در پایتون هستند ولی باید به این نکته مهم توجه داشته باشیم که قطعه‌بندی در NumPy یک کپی از داده‌ها ایجاد نمی‌کند. قطعه‌بندی یک نمایش جدید از همان داده‌ها ایجاد می‌کند.

اینک برای این‌که متوجه شویم اندیس‌گذاری در NumPy متفاوت از پایتون عمل می‌کند، می‌توانیم از اندیس‌های جداشده با کاما برای اندیس‌گذاری همزمان در راستای چند محور آرایه استفاده کنیم.

به اختلاف بین دو نتیجه اخیر نگاه کنید. استفاده از یک دونقطه برای آرایه‌های دو بعدی پایتون یک آرایه‌ی 1 بعدی ایجاد می‌کند، در حالی که استفاده از آن در یک ماتریس موجب ایجاد ماتریس 2بعدی می‌شود. یک قطعه‌بندی بر روی یک ماتریس همیشه یک ماتریس ایجاد می‌کند. برای مثال، یک قطعه‌بندی بر روی [:M[2 یک ماتریس به شکل (1,4) ایجاد می‌کند. برعکس قطعه‌بندی کردن یک آرایه همواره آرایه‌ای با ابعاد در کمترین مقدار ممکن تولید می‌کند. برای مثال اگر C یک آرایه 3 بعدی باشد، [C[…,1 یک آرایه 2 بعدی ایجاد می‌کند، در حالی که [C[1,:,1 یک آرایه 1 بعدی ایجاد می‌کند. از اینجا به بعد در این نوشته، ما نتایج قطعه‌بندی آرایه را زمانی نشان خواهیم داد که نتایج با قطعه‌بندی ماتریس متناظر یکسان باشد.

فرض کنید ما ستون‌های اول و سوم یک آرایه را بخواهیم جدا کنیم. یک روش این است که با استفاده از یک فهرست آن‌ها را جدا کنیم:

اگر بخواهیم ردیف نخست را نداشته باشیم، باید از روش زیر استفاده کنیم:

یا این‌که می‌توانیم به‌سادگی از [[A[1:,[1,3 استفاده کنیم. البته روش دیگری هم برای قطعه‌بندی ماتریس فوق وجود دارد که از حاصل‌ضرب خارجی استفاده می‌کند:

برای سهولت در ادامه بار دیگر آرایه را آورده‌ایم:

اینک می‌خواهیم یک کار اندکی پیچیده‌تر انجام بدهیم. فرض کنید بخواهیم همه ستون‌هایی که مقدار نخست ردیفشان بزرگ‌تر از 1 باشد را حفظ کنیم. یک روش ایجاد یک اندیس بولی است:

این همان است که می‌خواستیم! اما اندیس‌گذاری ماتریس کار چندان آسانی نیست.

مشکل این کار این است که قطعه‌بندی یک ماتریس، خود یک ماتریس ایجاد می‌کند. اما ماتریس‌ها خصوصیت A آسانی ندارند که مقدار آن بازنمایی یک آرایه باشد، بنابراین باید از روش زیر استفاده کنیم:

اگر بخواهیم یک ماتریس را به‌صورت مشروط در دو جهت قطعه‌بندی کنیم، باید راهبرد خود را اندکی تغییر دهیم. در واقع به‌جای روش زیر:

باید از حاصل‌ضرب خارجی ix_ استفاده کنیم:

نکات و ترفندها

در این بخش برخی نکات کوتاه و مفید برای استفاده از NumPy ارائه کرده‌ایم.

تغییر شکل «خودکار»

برای تغییر دادن ابعاد یک آرایه می‌توان یکی از اندازه‌ها را نادیده گرفت و بدین ترتیب به طور خودکار کاهش می‌یابد:

پشته‌سازی بردار

چگونه می‌توان یک آرایه 2 بعدی را از یک فهرست از بردارهای با ردیف‌های هم‌اندازه ایجاد کرد؟ در متلب (MATLAB) این کار بسیار آسان است: اگر x و y دو بردار با طول یکسان باشند تنها لازم است که دستور زیر را اجرا کنید: [m=[x;y. در NumPy این کار بسته به ابعادی که پشته‌سازی در آن انجام می‌شود، از طریق تابع‌های column_stack، dstack، hstack و vstack انجام می‌شود. برای مثال:

منطق پشت این تابع‌ها برای ابعاد بالاتر از 2 ممکن است کمی عجیب به نظر برسد.

هیستوگرام‌ها

وقتی تابع histogram در NumPy بر روی یک آرایه اعمال شود، یک جفت‌بردار بازمی‌گرداند: هیستوگرام یک آرایه و بردار bin ها.

فیلم آموزش کتابخانه های NumPy و Matplotlib در پایتون – تحلیل داده‌ تا رسم نمودار + گواهینامه در فرادرس

کلیک کنید

باید آگاه باشید که matplotlib هم یک تابع برای ساخت هیستوگرام‌ها دارد که از تابع موجود در NumPy متفاوت است. اختلاف اصلی این است که pylab.hist به طور خودکار هیستوگرام را ترسیم می‌کند در حالی که numpy.histogram تنها داده‌ها را ایجاد می‌کند.

اگر تمایل به مطالعه بیشتر در مورد این موضوعات را داشته باشید؛ شاید آموزش های زیر نیز برای شما مفید باشند:

محصول، خدمات یا برند خود را در مجله فرادرس معرفی کنید.

کلیک کنید

بر اساس رای ۹ نفر

آیا این مطلب برای شما مفید بود؟

اگر پرسشی درباره این مطلب دارید، آن را با ما مطرح کنید.

ثبت نظر

منابع:

github

میثم لطفی (+)

«میثم لطفی» در رشته‌های ریاضیات کاربردی و مهندسی کامپیوتر به تحصیل پرداخته و شیفته فناوری است. وی در حال حاضر علاوه بر پیگیری علاقه‌مندی‌هایش در رشته‌های برنامه‌نویسی، کپی‌رایتینگ و محتوای چندرسانه‌ای، در زمینه نگارش مقالاتی با محوریت نرم‌افزار با مجله فرادرس همکاری دارد.

مطالب مرتبط

کد ساخت بازی با پایتون – آموزش عملی برای مبتدیان

بازی سازی با یونیتی – به زبان ساده + پروژه برای شروع

یادگیری برنامه نویسی از پایه (رایگان) – به زبان ساده

آموزش گیت و گیت هاب از شروع تا آپلود پروژه – به زبان ساده

معتبرترین مدرک برنامه نویسی چیست؟ – لیست کامل برای مهاجرت و کار

چگونه مدرک برنامه نویسی بگیریم؟ – راهنمای جامع مدارک مهم و پول ساز بازار کار

پایتون پیشرفته – راهنمای کامل برای برنامه نویسان + آموزش، مثال و کد

تابع Enumerate در پایتون چیست؟ – به زبان ساده + مثال و کد

اصول Solid در سی شارپ – به زبان ساده + مثال عملی

ASP.NET Core چیست؟ – راهنمای جامع برای توسعه‌دهندگان

۸ دیدگاه برای «کتابخانه NumPy پایتون – راهنمای جامع – بخش دوم»

امیر

۲۳ اردیبهشت، در ۱۴۰۱ ۷:۱۲ ب.ظ

سلام
ماژول np.argmin چیکار میکنه دقیقا؟

پاسخ

سینا

۲۷ بهمن، در ۱۳۹۸ ۱۰:۵۵ ب.ظ

کاش فقط متنو ترجمه نمی کردید کاش یکمم توضیح حداقل می دادید

پاسخ

پریسا

۲۲ بهمن، در ۱۳۹۸ ۲:۵۱ ب.ظ

با سلام و خسته نباشید
خوبی سایت شما اینه که از همه مباحث سرفصل مطالب مربوط رو آورده که خیلی تو درک مطلب کمک می کنه مثلا همین برودکستینگ توی پایتون. درسته زیاد توضیحات مبسوط و درست حسابی راجع ریز مطالب ندادید و من مجبور شدم مدام سایتای خارجی رو برای بدست آوردن اطلاعات بیشتر مثلا راجع به تابع ix سرچ کنم ولی در کل تو سایتهای زبون فارسی بینظیره حتی تو سایتای خارجیم کم پیدا میشه که یه مطلبو به طور مبسوط توضیح داده باشند

پاسخ

پريسا

۱۹ بهمن، در ۱۳۹۸ ۲:۱۳ ب.ظ

سلام خيلي سايتتون مفيده گرچه زياد توضيح نداده دستوراتو ولي تنها سايت فارسيه كه مطالبو قشنگ و جامع توضيح داده بخصوص براي افراد شاغل كه كلاس حضوري نمي تونن بيان عاليه كاشكي يه دوره رفع اشكالي چيزي مي ذاشتيد كه ثبت نام مي كرديم و اشكالاتمونو برطرف مي كرديم

پاسخ

حسین

۱۵ آبان، در ۱۳۹۸ ۱:۴۴ ق.ظ

ضمن عرض سلام و خسته نباشید
من تازه میخام شروع به یادگیری پایتون بکنم. منتهی تمرکزم بیشتر روی یادگیری ماشین و بسته هایی مانند Numpy خاهد بود. اما از اونجایی که یادگیری خود زبان پایتون زمان بره (و اصولا بی انتها هم هست!)، به نظرتون پیش نیازهای پایتون برای داده کاوی چیست؟
ممنون

پاسخ

میثم لطفی

۲۰ آذر، در ۱۳۹۸ ۱۲:۵۴ ب.ظ

سلام دوست عزیز؛
این که یادگیری پایتون زمان‌بر یا به قول شما بی‌انتها است، نمی‌تواند دلیلی برای گام نگذاشتن در مسیر یادگیری باشد، کما این که چنین هم نیست و با کمی تلاش و پشتکار می‌توانید خیلی زود بر این زبان مسلط شوید.
اما در خصوص به دست آوردن تصویری کلی از مباحث مرتبط با داده‌کاوی، پیشنهاد می‌کنم این مطلب همکار خوبم، سرکار خانم حصارکی را مطالعه بفرمایید:
داده کاوی (Data Mining) — از صفر تا صد

Tayebe

۲۹ فروردین، در ۱۳۹۸ ۸:۴۲ ب.ظ

سلام و وقت بخیروباتشکراز زحمات شما دوست عزیز که مطالب مفیدودرخوری رو دراختیار هم نوعان خودت قرار دادی.
میخواستم بدونم چطور میشه با ازیک آرایه دوبعدی میانگین هر سطر رو بدست آورد ایا بایدازدستورخاصی استفاده کرد ممنون میشم که راهنماییم کنید

پاسخ

میثم لطفی

۲۹ فروردین، در ۱۳۹۸ ۹:۳۲ ب.ظ

سلام و وقت بخیر
برای محاسبه‌ میانگین حسابی ردیف‌های آرایه‌های دو بعدی(مثال با نام array) از دستور زیر استفاده می‌شود:
numpy.mean(array, axis = 1)
خروجی آن یک آرایه تک بعدی از میانگین ردیف‌های آرایه فوق است.

نظر شما چیست؟

برچسب‌ها

NumPy

PYTHON

راهنما

کتابخانه

آموزش پایتون

راهنمای جامع