توزیع احتمال چیست؟ – توضیح به زبان ساده با مثال
«توزیع احتمال» (Probability Distribution) یکی از مهمترین مفاهیم آماری است و یادگیری آن، به ما کمک میکند تا رفتار متغیرهای تصادفی را بهتر متوجه شویم. توزیع احتمال تابعی است که برای توصیف احتمال رخدادن تمام نتایج ممکن در یک آزمایش بکار میرود و با توجه به نوع متغیر تصادفی، ممکن است پیوسته یا گسسته باشد. در این مطلب از مجله فرادرس پس از اینکه توضیح دادیم توزیع احتمال چیست، با انواع مختلف توزیعهای احتمال آشنا میشوید. سپس یاد میگیرید تابع توزیع احتمال مربوط به هر نوع توزیع چه نام دارد و روش محاسبه پارامترهای توزیع احتمال چگونه است. پیشنهاد میکنیم برای درک بهتر هر مبحث، حتما مثالهای مرتبط را مطالعه کنید.
توزیع احتمال چیست؟
یک متغیر تصادفی ممکن است مقادیر مختلفی داشته باشد. فرض کنید برای امکان رخ دادن هر کدام از این مقادیر ممکن، یک احتمال در نظر بگیریم. در این صورت تابع ریاضی که برای توصیف این احتمالات بکار میرود، توزیع احتمال نام دارد. بنابراین توزیع احتمال یک متغیر تصادفی نشان میدهد که چگونه احتمالات رویدادهای مختلف روی مقادیر مختلفی از این متغیر توزیع شدهاند. یک توزیع احتمال ویژگیهای مختلفی دارد که قابل اندازهگیری است، مانند امید ریاضی و انحراف معیار. معمولا برای نشان دادن توزیع احتمال از نمودار یا جدول احتمال استفاده میشود.
انواع توزیعهای احتمال که در بررسی مسائل مختلف آماری بیشترین کاربرد را دارند، عبارتاند از:
- «توزیع پواسون» (Poisson Distribution)
- «توزیع یکنواخت گسسته» (Uniform Distribution)
- «توزیع دو جملهای» (Binomial Distribution)
- «توزیع هندسی» (Geometric Distribution)
- «توزیع فوقهندسی» (Hyper Geometric Distribution)
- «توزیع برنولی» (Bernoulli Distribution)
این گروه از توزیعهای احتمال را توزیعهای احتمال گسسته یا Discrete مینامند. از طرفی انواع دیگری از توزیعهای احتمال را داریم که بیشتر با هدف سنجش فرضیات استفاده میشوند. این گروه توزیعهای احتمال پیوسته یا Continuous نامیده میشوند که شامل موارد زیر است:
- «توزیع نرمال استاندارد» (Standard Normal)
- «توزیع تی - استیودنت» (Student’s t Distribution)
- «توزیع نمایی» (Exponential Distribution)
- «توزیع یکنواخت پیوسته» (Uniform Distribution)
در تصویر زیر چند نمونه از انواع توزیعهای احتمال نشان داده شده است. اگر دقت کنید شکل نمودار در مورد توزیعهای ردیف بالا که در گروه توزیعهای احتمال پیوسته قرار دارند، بهصورت یک منحنی پیوسته است. اما در ردیف پایین و برای توزیعهای احتمال گسسته، نمودارها بهصورت مقادیری مجزا و تفکیک شده و شبیه چند نمودار میلهای با شکلهای مختلف هستند.
کاربرد توزیعهای احتمال در توصیف جامعه آماری متغیرهایی است که در زندگی واقعی با آنها سروکار داریم. همچنین به منظور آزمودن برخی فرضیات نیز از توزیعهای احتمال خاصی استفاده میشود تا «مقدار احتمال» (p-value) تعیین شود. پیش از اینکه به بررسی جنبههای مختلف توزیع احتمال بپردازیم، بهتر است ابتدا در مورد مفاهیم پایهای مانند تعریف احتمال و متغیر تصادفی صحبت کنیم. تسلط کامل به این دو مبحث به شما کمک میکند تا بهتر متوجه شوید که یک توزیع احتمال چیست.
احتمال چیست؟
در بخش قبل تا حدی متوجه شدیم که توزیع احتمال چیست. در این بخش قصد داریم توضیح دهیم که احتمال چیست. احتمال یک مفهوم ریاضیاتی است که شانس رخ دادن یک اتفاق را با عددی بین ۰ و ۱ به ما نشان میدهد تا بتوانیم آن را اندازهگیری کنیم و در نهایت بر این اساس، پیشبینی انجام دهیم.
احتمال صفر به معنای این است که احتمال رخ دادن یک اتفاق صفر است، در حالی که احتمال یک به معنای قطعیت کامل در رخ دادن آن اتفاق است. اگر احتمال برابر با عدد بزرگتری شود، به این معنا است که فراوانی مقدار موردنظر ما در نمونه بیشتر است. اگر بخواهیم دقیقتر بیان کنیم، احتمال وقوع یک مقدار معادل فراوانی نسبی آن مقدار در یک نمونه بینهایت بزرگ است. البته نمونههای بینهایت بزرگ در زندگی واقعی نمود عینی ندارند و به همین دلیل است که توزیع احتمال یک نظریه است.
مسیر یادگیری آمار و احتمال با فرادرس
در بخش اول تا حدی متوجه شدیم که توزیع احتمال چیست و چه انواعی دارد. اگر دانشآموز هستید، در این قسمت قصد داریم با توجه به فیلمهای آموزشی تهیه شده در مجموعه فرادرس، به شما یک مسیر یادگیری در زمینه آمار و احتمال پیشنهاد کنیم.
چنانچه در رشته علوم انسانی مشغول به تحصیل هستید، مشاهده فیلمهای آموزشی زیر به شما در یادگیری مفاهیمی مانند آمار توصیفی، احتمال و توزیعهای احتمالاتی کمک میکند:
- فیلم آموزش ریاضی و آمار دهم انسانی فرادرس
- فیلم آموزش ریاضی و آمار دهم حل سوالات کنکور فرادرس
- فیلم آموزش ریاضی و آمار دوازدهم انسانی فرادرس
- فیلم آموزش ریاضی و آمار دوازدهم حل سوالات کنکور فرادرس
اما اگر در رشتههای ریاضی یا علوم تجربی در حال تحصیل هستید، میتوانید به لیست زیر برای مشاهده فیلمهای آموزشی با موضوع آمار و احتمال مراجعه کنید:
- فیلم آموزش ریاضی دهم تجربی و ریاضی فرادرس
- فیلم آموزش ریاضی یازدهم تجربی فرادرس
- فیلم آموزش ریاضی دوازدهم تجربی فرادرس
- فیلم آموزش آمار و احتمال پایه یازدهم فرادرس
متغیر تصادفی چیست؟
برای اینکه بهتر یاد بگیرید توزیع احتمال چیست، دانستن معنای یکی دیگر از مفاهیم مهم آماری به نام «متغیر رندوم یا تصادفی» (Random Variables) ضروری است. اما پیش از آن، در ابتدای این بخش، فیلم آموزشی ریاضی و آمار ۱ رشته علوم انسانی فرادرس را به شما معرفی میکنیم که در آن انواع متغیرها و مقیاسهای اندازهگیری آنها در دو فصل آخر کتاب درسی ریاضی و آمار پایه دهم آموزش داده میشود. با مشاهده این فیلم به مفاهیم پایه کاملا مسلط خواهید شد. در ادامه لینک این آموزش برای شما قرار داده شده است:
هر متغیری که مقدار آن به یک آزمایش شانسی یا تصادفی بستگی داشته باشد، متغیر تصادفی نامیده میشود. این متغیر تابعی با مقدار حقیقی است که دامنه آن، فضای نمونه آزمایش تصادفی است. برای نمایش متغیر تصادفی معمولا از حروف لاتین بزرگ مانند X یا Y یا Z استفاده میشود. نحوه نمایش متغیر تصادفی X با توجه به تعریفی که ارائه شد، به شکل زیر است:
عدد حقیقی = (فضای نمونه)X
همانطور که در شکل بالا مشاهده میکنید، متغیر تصادفی X تابعی است که یک عدد حقیقی را به یک رویداد مربوط میکند. این جمله به معنی نسبت دادن هر نتیجه ممکن به یک مقدار (عدد حقیقی) است. انتخاب متغیر تصادفی ما بر اساس نیازمان، ممکن است به شکلهای مختلفی انجام شود.
فرض کنید میخواهیم ببینیم نتیجه پرتاب یک سکه چه خواهد شد. متغیر تصادفی خود را برای این آزمایش تصادفی به این شکل انتخاب میکنیم که اگر سکه رو بیاید، عدد حقیقی متناظر با متغیر تصادفی X برابر است با ۱، در حالی که اگر سکه زیر بیاید، . پس متغیر تصادفی X دارای دو مقدار ممکن است، ۰ یا ۱ که بسته به نتیجه آزمایش تصادفی، یکی از این دو مقدار را خواهیم داشت.
برای نمایش مقادیر ممکن X، میتوانیم از توزیع احتمال استفاده کنیم. این توزیع به ما میگوید که احتمال رخ دادن هر مقدار ممکن چقدر است. برای نمونه، توزیع احتمال برای مثال پرتاب سکه به شکل زیر خواهد شد، چون احتمال رو یا زیر آمدن سکه در هر بار پرتاب برابر است با ۱/۲:
انواع متغیرهای تصادفی چه هستند؟
پس از اینکه با مفهوم متغیر تصادفی آشنا شدیم، لازم است انواع متغیر تصادفی را بشناسیم تا بتوانیم تشخیص دهیم انواع توزیع احتمال چیست. اگر بخواهید متغیر تصادفی را که بیانگر قد اولین شخصی است که وارد اتاق میشود، در نظر بگیرید، در واقع یک متغیر تصادفی پیوسته را انتخاب کردهاید. چون قد شخص ممکن است ۱۶۰ سانتیمتر یا ۱۶۰٫۲ سانتیمتر باشد و به عبارت دیگر، قد شخص یک عدد صحیح نیست.
اما متغیر تصادفی که نشان دهد اعداد بهدست آمده در تاس انداختن کدام هستند، یک متغیر تصادفی گسسته است. چون در هر بار تاس انداختن یک عدد صحیح از ۱ تا ۶ خواهیم داشت و برای مثال با عددی مثل ۵٫۳ مواجه نخواهیم شد. پس متغیرهای تصادفی دو نوع هستند:
- متغیر تصادفی پیوسته: بازه یک متغیر تصادفی پیوسته شامل مجموعه غیرقابلشمارشی از اعداد است، طوری که نمیتوان آنها را از هم تفکیک کرد.
- متغیر تصادفی گسسته: بازه یک متغیر تصادفی گسسته شامل یک مجموعه گسسته یا تفکیکشده از اعداد است.
برای مثال فرض کنید یک سکه را ۵ مرتبه پرتاب میکنیم. حالا اگر در این آزمایش متغیر تصادفی را بهصورت تعداد دفعات رو آمدن سکه تعریف کنیم، در این صورت متغیر تصادفی ما میتواند مقادیری بهصورت ۰، ۱، ۲، ۳، ۴ یا ۵ را بپذیرد. بنابراین در اینجا متغیر تصادفی از نوع گسسته است. در مثال زیر بهتر مشخص میشود چرا نیاز داریم مفهوم متغیر تصادفی را یاد بگیریم. همچنین روند بررسی مسائل آمار و احتمال و ساخت فضای نمونه را بهتر متوجه خواهید شد.
بررسی متغیر تصادفی در مثال پرتاب سکه
فرض کنید میخواهیم پس از ۲ مرتبه پرتاب یک سکه، به سوالات زیر پاسخ دهیم:
- احتمال اینکه دقیقا هر ۲ بار رو بیاوریم، چقدر است؟
- احتمال اینکه فقط یک بار رو بیاوریم، چقدر است؟
در پرتاب یک سکه دو حالت ممکن است اتفاق بیفتد، یا ممکن است پشت سکه را ببینیم، که این احتمال را با T نشان میدهیم و یا ممکن است روی سکه را مشاهده کنیم، که این احتمال را با H نشان میدهیم. طبق سوال ۲ مرتبه پرتاب سکه داریم. پس چهار حالت ممکن است اتفاق بیفتد:
- HH: در هر دو پرتاب رو بیاید.
- HT: در پرتاب اول رو و در پرتاب دوم زیر بیاید.
- TH: در پرتاب اول زیر و در پرتاب دوم رو بیاید.
- TT: در هر دو پرتاب زیر بیاید.
به این ترتیب فضای نمونه یا S برای این آزمایش را به شکل زیر مینویسیم:
حالا باید متغیر تصادفی X را بر اساس سوال انتخاب کنیم، به گونهای که تعداد دفعات زیر یا رو را طبق خواسته ما بشمارد. انتخاب ما این است:
متغیر تصادفی X برابر است با تعداد دفعاتی که سکه رو میآید.
پس برای هر نتیجه، مقدار متغیر تصادفی بهصورت زیر خواهد شد:
برای پاسخ به اولین سوال، باید ببینیم چند بار مقدار عددی X برابر با ۲ شده است. طبق روابط بالا، این اتفاق از چهار امکانی که داریم فقط یک بار رخ ممکن است دهد. پس از فرمول احتمال به شکل زیر استفاده میکنیم:
- : احتمال اینکه دو بار سکه رو بیاید.
- : تعداد مقادیر
- : تعداد مقادیر فضای نمونه یا S
با توجه به تعریفهای بالا است و . بنابراین احتمال میشود:
برای پاسخ به سوال بعدی، باید ببینیم چند بار داشتهایم که میشود:
در نتیجه احتمال برای سوال دوم خواهد شد:
دقت کنید ممکن است به مقادیر متغیر تصادفی یکسان، بیشتر از یک رویداد نسبت داده شود. مثلا در روابط بالا، برای دو نوع رویداد مختلف داشتیم.
توزیع فراوانی چیست؟
از آنجا که توزیع احتمال در واقع یک توزیع فراوانی ایدهآل است، در این بخش به توضیح «توزیع فراوانی» (Frequency Distribution) میپردازیم تا ببینیم ارتباط آن با توزیع احتمال چیست. توزیع فراوانی برای توصیف یک نمونه خاص یا یک مجموعه داده بکار میرود و به معنای تعداد دفعات رخ دادن هر مقدار ممکن برای هر متغیر در یک مجموعه داده است.
توزیعهای احتمال نوع ایدهآل توزیعهای فراوانی در نظر گرفته میشوند تا بتوانند جامعهای که نمونه از آن استخراج میشود را توصیف کنند. در واقع تفاوت توزیع فراوانی با توزیع احتمال در این است که توزیع احتمال نهتنها نشان میدهد که تعداد نتیجههای ممکن چقدر است، بلکه به هر نتیجه احتمالی را نیز نسبت میدهد. این احتمالات نشان میدهند که احتمال رخداد هر نتیجه چقدر است. بنابراین توزیع احتمال اطلاعات بیشتری به ما میدهد، هرچند که برای تشخیص توزیع احتمال بهتر است توزیع فراوانی را ابتدا بدانیم. مثال بخش بعد به شما کمک میکند تا کاملا متوجه شوید چگونه میتوان از توزیع فراوانی به توزیع احتمال رسید و پیشبینی احتمالاتی دقیقتری برای حل مسئله ارائه کرد.
مثال ارتباط توزیع فراوانی و توزیع احتمال
در این بخش با بررسی یک مثال عددی بهتر درک خواهید کرد که ارتباط توزیع فراوانی با توزیع احتمال چیست. همچنین متوجه خواهید شد که معنای جمله «توزیعهای احتمال همان توزیعهای فراوانی ایدهآل هستند» چیست. میخواهیم نشان دهیم که چگونه میتوان پس از رسم هیستوگرام توزیع فراوانی با کاربرد توزیع احتمال، به یک برآورد دقیقتر رسید. فرض کنید مزرعهداری یک آناناس را بهصورت تصادفی انتخاب میکند و میخواهد به سوال زیر پاسخ دهد:
احتمال اینکه این آناناس دارای وزن خاصی (مثلا ۱٫۸ کیلوگرم) باشد، چقدر است؟
برای پاسخ به سوال بالا، لازم است ابتدا مزرعهدار تعداد ۱۰۰ عدد آناناس را به شکل تصادفی انتخاب کرده و هر کدام را وزن کند. با نوشتن وزن هر کدام، مشاهده میکند که برای مثال ممکن است ۱۵ عدد آناناس وزنی برابر با ۱٫۶ کیلوگرم داشته باشند، این یعنی فراوانی وزن ۱٫۶ کیلوگرم میشود ۱۵. بنابراین پس از بررسی فراوانی وزنهای مختلف، میتوان برای نمایش توزیع فراوانی وزن این ۱۰۰ عدد آناناس، یک هیستوگرام به شکل زیر رسم کرد:
- محور افقی: وزن آناناس (بر حسب کیلوگرم)
- محور عمودی: فراوانی مقادیر وزن
با توجه به این هیستوگرام، مزرعهدار میتواند به این نتیجه برسد که احتمال رخ دادن وزنهای مختلف برای هر آناناس انتخابی چقدر است. مثلا احتمال اینکه یک آناناس وزنی حدود ۱٫۹ کیلوگرم داشته باشد، نسبت به اینکه وزنی بیشتر از ۲٫۱ کیلوگرم داشته باشد، خیلی بیشتر است.
حالا فرض کنید مزرعهدار میخواهد برآوردهای احتمالاتی دقیقتری داشته باشد. یک روش برای رسیدن به این پیشبینی دقیقتر این است که بهجای ۱۰۰ عدد آناناس، تعداد خیلی بیشتری را وزن کند. اما راهحل بهتر این است که با توجه به شکل هیستوگرام رسم شده، تشخیص دهد که وزن آناناسها از کدام نوع توزیع احتمال پیروی میکنند.
در این مثال، توزیع فراوانی از توزیع احتمال معروفی به نام توزیع نرمال پیروی میکند که نمودار آن به شکل بالا است. در نتیجه مزرعهدار با فرض اینکه وزن آناناسها بهصورت نرمال توزیع شدهاند، میتواند یک ورژن ایدهآلتر از توزیع فراوانی بالا را برای بررسی در نظر بگیرد. از آنجایی که توزیعهای نرمال توسط متخصصین آمار خیلی خوب درک میشوند، مرزعهدار میتواند با کمک گرفتن از آنها تخمین احتمالاتی دقیقتری داشته باشد. در بخشهای بعد یاد میگیریم که چگونه پارامترهای توزیع احتمال را محاسبه کنیم تا بتوانیم برآورد دقیقتری از وضعیت جامعه آماری خود داشته باشیم.
نحوه نمایش توزیع احتمال
پس از اینکه متوجه شدیم متغیر موردنظرمان از کدام توزیع احتمال پیروی میکند، باید بدانیم نحوه نمایش این توزیع احتمال چیست. متغیرهایی که از یک توزیع احتمال پیروی میکنند، همان متغیرهای رندوم یا تصادفی هستند. به عبارت دیگر، متغیرهای تصادفی از یک توزیع مشخص پیروی میکنند. حالا اگر بخواهیم این جمله را با عبارتهای ریاضی نشان دهیم، به این صورت عمل میکنیم:
- متغیرهای تصادفی را با X نشان میدهیم.
- برای مشخص کردن اینکه این متغیر تصادفی از یک توزیع پیروی میکند، از علامت ∼ استفاده میکنیم.
- توزیعی که متغیر تصادفی از آن پیروی میکند، معمولا با یک حرف لاتین بزرگ نمایش داده میشود و معمولا این حرف، اولین حرف نام آن توزیع است (برای مثال، توزیع نرمال را با N نشان میدهیم).
- در کنار این حرف، از یک پرانتز برای نشان دادن پارامترهای توزیع استفاده میشود (برای نمونه، میانگین و واریانس پارامترهای توزیع نرمال محسوب میشوند).
در نتیجه عبارت زیر بیانگر این است که برای مثال، متغیر تصادفی X از یک توزیع نرمال با میانگین μ و واریانس σ۲ پیروی میکند:
انواع توزیع احتمال چیست؟
پس از اینکه یاد گرفتیم نحوه نمایش توزیع احتمال چیست، لازم است با انواع توزیعهای احتمال بیشتر آشنا شویم. یکی از انواع تقسیمبندیهای توزیع احتمال بر اساس نوع متغیر (گسسته یا پیوسته) است. با توجه به اینکه متغیر موردنظر گسسته است یا پیوسته، دو نوع توزیع احتمال داریم:
- توزیعهای احتمال گسسته
- توزیعهای احتمال پیوسته
در ادامه ویژگیهای هر کدام از این توزیعها را بیشتر توضیح میدهیم و برای هر کدام، یک تابع توزیع احتمال تعریف میکنیم. همچنین با معادلات ریاضی مربوط به چند توزیع احتمال معروف آشنا خواهید شد.
توزیع احتمال گسسته چیست؟
میخواهیم ببینیم نوع گسسته توزیع احتمال چیست. توزیع احتمال گسسته به توزیع احتمال متغیرهای گسسته یا «متغیرهای رستهای یا طبقهای» (Categorical Variables) گفته میشود. توزیعهای احتمال گسسته فقط شامل احتمالات مقادیر ممکن هستند، یعنی یک توزیع احتمال گسسته شامل مقادیری با احتمال صفر نیست. نمودار زیر نشان میدهد که در آزمایش تصادفی ۱۰ مرتبه پرتاب یک سکه، توزیع احتمال تعداد دفعات رو آمدن سکه چه شکلی دارد.
بهعنوان مثال دیگر، توزیع احتمال ریختن تاس را در نظر بگیرید که هیچ گاه شامل مقدار ۲٫۵ نیست، چون این نتیجه برای ریختن تاس ممکن نیست. پس توزیع احتمالی که برای ریختن تاس در نظر میگیریم، یک توزیع احتمال گسسته است. مجموع احتمالات تمام مقادیر ممکن در یک توزیع احتمال گسسته باید برابر با یک شود و قاطعانه میتوانیم بگوییم که در هر مشاهده، یکی از مقادیر ممکن را خواهیم داشت. توزیعهای احتمال گسسته با استفاده از جداول احتمال و «توابع جرم احتمال» (Probability Mass Functions) یا PMFها توصیف میشوند که در ادامه هر کدام را شرح میدهیم.
جدول احتمال چیست؟
در این قسمت یاد میگیریم که ارتباط جداول احتمال با توزیع احتمال چیست. گفتیم یکی از راههای توصیف یک توزیع احتمال گسسته این است که از جداول احتمال استفاده کنیم. بهطور دقیقتر، برای نمایش توزیع احتمال گسسته یک متغیر طبقهای یا یک متغیر گسسته، از جدول احتمال استفاده میشود. این جدول علاوه بر اینکه برای نمایش یک متغیر گسسته با تعداد محدودی از مقادیر ممکن بکار میرود، جهت توصیف متغیرهای پیوستهای که با فاصله طبقات گروه شدهاند، نیز استفاده میشوند. یک جدول احتمال شامل دو ستون است:
- مقادیر یا فواصل طبقات
- احتمالات آنها
در بخش بعد در قالب یک مثال، هم نمونهای از توزیع احتمال گسسته برای یک متغیر گسسته را مشاهده میکنید و هم با نحوه نمایش این توزیع به کمک یک جدول احتمال آشنا خواهید شد.
مثال نمایش توزیع احتمال گسسته با جدول احتمال
در این مثال نمونهای از یک جدول احتمال را با هم بررسی میکنیم تا بهتر متوجه شوید که یکی از روشهای نمایش توزیع احتمال چیست. فرض کنید یک ربات طوری طراحی شده است که بهصورت تصادفی با مردم به شکلهای مختلفی احوالپرسی میکند. توزیع احتمال گسسته نحوه احوالپرسی را با جدول احتمال زیر نشان میدهیم که در آن نحوه احوالپرسی، متغیر گسسته ما است:
نحوه احوالپرسی | احتمال |
حال شما چطور است؟ | |
سلام | |
خوب هستید؟ | |
روز خوبی داشتهاید؟ |
اگر دقت کنید هر احتمال دارای مقداری بزرگتر از صفر است و مجموع تمام احتمالات هم برابر با یک است:
تابع جرم احتمال (PMF) چیست؟
تا اینجا آموختیم که اگر متغیر موردنظرمان گسسته باشد، روش نمایش توزیع احتمال چیست. حالا اگر بخواهیم نمایش ریاضیاتی خاصی برای توزیع این متغیر تصادفی گسسته در نظر بگیریم، از تابع جرم احتمال یا PMF استفاده میکنیم. PMF احتمال وقوع هر مقدار ممکن از یک متغیر را میدهد. تابع جرم احتمال به شکل یک معادله ریاضی یا یک نمودار میتواند بیان شود. در مثال زیر، بهتر متوجه نحوه نمایش این تابع خواهید شد.
مثال نمایش توزیع احتمال گسسته با تابع جرم احتمال
در این مثال نشان میدهیم که روش نمایش تابع جرم احتمال برای توصیف یک توزیع احتمال چیست. فرض کنید تعداد ژاکتها به ازای هر شخص در آمریکا، از توزیع احتمالی به نام توزیع پواسون پیروی کند. گفتیم برای توصیف این توزیع میتوانیم از تابع جرم احتمال در قالب یک معادله ریاضی یا یک نمودار استفاده کنیم. PMF توزیع پواسون با معادله ریاضی زیر مشخص میشود:
که در آن احتمال این است که هر شخص دقیقا k ژاکت داشته باشد. λ به معنای تعداد میانگین ژاکتها به ازای هر نفر است. همچنین میدانیم e ثابت اویلر است و تقریبا برابر است با ۲٫۷۱۸. تابع جرم احتمال بالا را میتوان با نموداری به شکل زیر هم نمایش داد:
توجه کنید که طبق شکل بالا، هر متغیر میتواند تنها مقادیر مشخصی را بپذیرد که با دایره توپر در شکل نشان داده شده است. این نشان میدهد که متغیر ما یا همان تعداد ژاکتها، یک متغیر گسسته است. بنابراین هر نفر میتواند تعداد ۲ یا ۱۰ ژاکت داشته باشد، اما ممکن نیست ۳٫۸ عدد ژاکت داشته باشد! همچنین از گراف بالا میتوان نتیجه گرفت که احتمال اینکه یک شخص هیچ ژاکتی نداشته باشد برابر است با ۰٫۰۵. این در حالی است که احتمال داشتن ۱ عدد ژاکت برابر است با ۰٫۱۵ و به همین ترتیب. اگر تمام احتمالات ممکن برای هر تعداد ژاکت ممکن به ازای یک شخص را با هم جمع کنید، برابر با یک خواهد شد.
تابع جرم احتمال در مثال پرتاب سکه
تا اینجا آموختیم که توزیع احتمال برای یک متغیر تصادفی گسسته تابع جرم احتمال نامیده میشود. در واقع PMF بیانگر احتمالی است که متغیر تصادفی یک مقدار خاص را میپذیرد. فرض کنید متغیر تصادفی X تعداد دفعاتی را نشان میدهد که در ۳ مرتبه پرتاب سکه رو میبینیم. میخواهیم ببینیم PMF برای X به چه صورت است.
فرض کنید احتمال دیدن پشت یا زیر سکه را با T نشان دهیم و احتمال دیدن روی آن را با H. به روشی که در مثال بخش متغیر تصادفی توضیح دادیم، عمل میکنیم. پس اولین کار این است که فضای نمونه را تشخیص دهیم. چون ۳ مرتبه پرتاب سکه داریم، پس هشت حالت ممکن است اتفاق بیفتد ():
- HHH: در هر سه پرتاب رو بیاید.
- HTT: در پرتاب اول رو و در دو پرتاب دیگر زیر بیاید.
- THH: در پرتاب اول زیر و در دو پرتاب دیگر رو بیاید.
- HHT: در دو پرتاب اول رو و در پرتاب سوم زیر بیاید.
- TTH: در دو پرتاب اول زیر و در پرتاب سوم رو بیاید.
- HTH: در پرتاب اول رو، پرتاب دوم زیر و در پرتاب سوم رو بیاید.
- THT: در پرتاب اول زیر، پرتاب دوم رو و در پرتاب سوم زیر بیاید.
- TTT: در هر سه پرتاب زیر بیاید.
به این ترتیب فضای نمونه یا S برای این آزمایش را به شکل زیر مینویسیم:
متغیر تصادفی X بر اساس سوال برابر است با تعداد دفعات رو آمدن سکه. با ۳ مرتبه پرتاب سکه، X ممکن است مقادیر ۰ یا ۱ یا ۲ یا ۳ را بپذیرد:
حالا از فرمول احتمال استفاده میکنیم که در آن برای مثال، احتمال این است که در این آزمایش فقط یک بار روی سکه دیده شود و برابر است با تعداد مقادیر . مثلا با توجه به روابط بالا میتوانیم بنویسیم، . همچنین تعداد اجزای فضای نمونه یا S است که میشود ۸. پس تابع توزیع احتمال یا PMF برای این مثال به شکل زیر است:
همانطور که انتظار داریم، اگر احتمالات بالا را با هم جمع کنیم، حاصل برابر با یک خواهد شد.
معرفی چند توزیع احتمال گسسته
در بخشهای قبل به توضیح ویژگیهای توزیع احتمال گسسته پرداختیم و یاد گرفتیم راههای توصیف این نوع توزیع احتمال چیست. در این بخش میخواهیم چند مورد از مرسومترین توزیعهای احتمال گسسته را برای شما معرفی کنیم که عبارتاند از:
- توزیع احتمال گسسته دو جملهای
- توزیع احتمال گسسته یکنواخت
- توزیع احتمال گسسته پواسون
اگر خاطرتان باشد، در ابتدای مطلب نیز به این سه نوع توزیع، بهعنوان پرکاربردترین انواع توزیعهای احتمال اشاره کردیم. حالا میدانیم که این سه توزیع در گروه توزیعهای احتمال گسسته قرار میگیرند. جزئیات مربوط به هر کدام از این توزیعها بسیار گسترده است و ما در این نوشته بهصورت مختصر هر کدام را فقط معرفی میکنیم. همچنین معادله ریاضیاتی تابع جرم احتمال را برای هر توزیع بیان خواهیم کرد. چنانچه تمایل دارید برای مثال در مورد توزیع چندجملهای اطلاعات بیشتری کسب کنید، پیشنهاد ما این است که مطلب «متغیر تصادفی و توزیع چند جمله ای (Multinomial Distribution) — به زبان ساده» از مجله فرادرس را مطالعه کنید.
توزیع احتمال دو جملهای چیست؟
در این قسمت میخواهیم ببینیم توزیع احتمال دو جملهای بهعنوان یکی از پرکاربردترین انواع توزیع احتمال چیست و با چه معادلهای نشان داده میشود. توزیع احتمال یک متغیر تصادفی دو جملهای، توزیع احتمال دو جملهای نامیده میشود. متغیر تصادفی دو جملهای، نوعی متغیر تصادفی گسسته است که تعداد موفقیتها را در یک تعداد ثابت آزمایش تصادفی بهدست میدهد، با این شرایط که هر آزمایش فقط دو نتیجه ممکن دارد و احتمال موفقیت نیز ثابت است. متغیرهای تصادفی که در مثال پرتاب سکه انتخاب کردیم، نمونهای از متغیرهای تصادفی دوجملهای هستند.
پس در توزیع احتمال دوجملهای، متغیرها دارای دو نتیجه ممکن هستند. این توزیع توصیف کننده تعداد دفعات موفقیت در n تلاش است و احتمال موفقیت در آن با p نمایش داده میشود. برای مثال، فرض کنید یک سکه را ۵ بار پرتاب میکنید. اگر بخواهید تعداد دفعاتی که سکه رو میآید را نمایش دهید، بهترین انتخاب توزیع احتمال دوجملهای است، چون هم دو مقدار نتیجه ممکن دارید (زیر یا رو) و هم بهترین توصیف برای این موقعیت این است که نشان دهید در بار تلاش، احتمال موفقیت یا p چقدر بوده است. تابع جرم احتمال برای توزیع احتمال دوجملهای دارای فرمول زیر است:
توزیع احتمال یکنواخت گسسته چیست؟
در ادامه یادگیری خود میخواهیم ببینیم نوع یکنواخت توزیع نرمال چیست و چه ویژگیهایی دارد. توزیع احتمال گسسته یکنواخت برای توصیف رویدادهایی با احتمالات برابر بکار میرود. برای مثال تقاضای کشیدن کارت بهصورت تصادفی. تابع جرم احتمال برای این نوع توزیع احتمال یکنواخت دارای فرمول زیر است:
توزیع احتمال پواسون چیست؟
اگر بخواهیم بدانیم یکی دیگر از مرسومترین انواع توزیع احتمال چیست، بهتر است با فرمول توزیع پواسون آشنا شویم. توزیع احتمال پواسون دادههای قابل شمارش را توصیف میکند. این نوع توزیع، احتمال وقوع یک رویداد با تعداد k بار در یک فاصله زمانی یا مکانی داده شده را میدهد. برای مثال تعداد پیامهای دریافت شده هر روز. همچنین فرمول تابع جرم احتمال برای این توزیع به شکل زیر است:
توزیع احتمال پیوسته چیست؟
پس از اینکه با انواع توزیعهای احتمال گسسته آشنا شدیم، در این بخش میخواهیم ببینیم نوع پیوسته یک توزیع احتمال چیست. توزیع احتمال پیوسته توزیعی است که برای نمایش احتمالات وقوع یک متغیر پیوسته بکار میرود. متغیر پیوسته میتواند هر مقداری بین کمترین مقادیر ممکن و بیشترین مقدار ممکن خود داشته باشد. بنابراین توزیع احتمال پیوسته شامل هر نوع عددی خواهد بود.
در بخشهای قبل دیدیم که برای نمایش یک توزیع احتمال گسسته میتوانیم از جدول احتمال استفاده کنیم. همچنین یاد گرفتیم اگر بخواهیم توزیع احتمال گسسته را توسط یک معادله ریاضی توصیف کنیم، تابع جرم احتمال یا PMF را مینویسیم. در ادامه این بخش توضیح میدهیم که توصیف ریاضیاتی یک توزیع احتمال پیوسته با نوشتن «تابع چگالی احتمال» (Probability Density Function) یا PDF امکانپذیر است.
تابع چگالی احتمال (PDF) چیست؟
در بخشهای گذشته آموختیم که برای متغیرهای گسسته تابع توزیع احتمال چیست و چه نام دارد. در این بخش یاد میگیریم که برای توصیف یک توزیع احتمال پیوسته نیز میتوان از یک معادله ریاضی به نام تابع چگالی احتمال یا PDF استفاده کرد. این معادله، چگالی احتمال هر مقدار ممکن برای یک متغیر را میدهد که میتواند از یک بزرگتر باشد. تابع چگالی احتمال را مانند تابع جرم احتمال میتوان به شکل نمودار یا یک معادله ریاضی نمایش داد.
در فرم نموداری، تابع چگالی احتمال به شکل یک منحنی است و شما میتوانید احتمال اینکه یک مقدار موردنظر در یک فاصله مشخص قرار بگیرد را تعیین کنید. روش کار به این صورت است که کافی است مساحت زیر منحنی را در آن بازه محاسبه کنید. همچنین میتوانید از نرمافزار یا جداول مرجع برای انجام محاسبات کمک بگیرید. دقت کنید مساحت زیر منحنی کامل همیشه دقیقا برابر با یک است، چون کاملا مشخص است که هر مشاهده حتما در یک نقطه از بازه متغیر قرار خواهد گرفت.
نکته: یکی دیگر از توابعی که از نظر ریاضیاتی میتواند یک توزیع احتمال پیوسته را بهخوبی توصیف کند، «تابع توزیع تجمعی» (Cumulative Distribution Function) یا CDF است.
در مثال بخش بعد، با تابع چگالی احتمال یا PDF یک نوع توزیع پیوسته و نمودار مربوط به آن آشنا خواهیم شد.
مثال نمایش توزیع احتمال پیوسته با تابع چگالی احتمال
فرض کنید متغیر پیوستهای که قرار است بررسی کنیم، وزن آناناسی است که از توزیع احتمال پیوستهای به نام توزیع نرمال پیروی میکند. میخواهیم ببینیم فرمول تابع چگالی احتمال یا PDF و نمودار مرتبط با این توزیع احتمال چیست. فرمول توزیع احتمال نرمال بهصورت زیر است:
که در آن f(x) چگالی احتمال وزن آناناس است. μ میانگین وزن آناناس نسبت به جامعه آماری است. اگر خاطرتان باشد در PMF مثال قبل میانگین با λ نشان داده میشد، اما برای PDF در این مثال، میانگین با μ نمایش داده میشود. پارامتر دیگری که در PDF داریم اما در PMF نداشتیم، σ یا انحراف معیار متغیر پیوسته یا وزن آناناس در جامعه است که در این مثال ۰٫۱۳ کیلوگرم خواهد شد. نحوه محاسبه مقادیر میانگین و انحراف معیار را در بخشهای بعد حتما توضیح میدهیم. اگر تابع چگالی احتمال بالا را برای این توزیع نرمال به شکل یک نمودار نشان دهیم، بهصورت زیر خواهد شد:
طبق شکل، احتمال اینکه یک آناناس وزنی کاملا برابر با ۲ کیلوگرم داشته باشد، صفر است. یعنی ممکن است وزن آناناسی خیلی خیلی نزدیک به ۲ کیلوگرم اندازهگیری شود، اما احتمالی برای اینکه وزن آن دقیقا ۲ کیلوگرم شود، وجود ندارد. علت این مسئله این است که گفتیم در مورد PDF باید سطح زیر منحنی را در نظر بگیریم. اگر یک نقطه مشخص مانند نقطه معادل با وزن ۲ کیلوگرم را روی محور افقی انتخاب کنیم، سطحی در زیر منحنی تشکیل نخواهد شد. اما با انتخاب یک بازه یا فاصله مشخص، میتوانیم سطح زیر منحنی را تشکیل دهیم و با محاسبه مساحت آن احتمال را تعیین کنیم.
مثلا احتمال اینکه وزن یک آناناس در یک فاصله وزنی مشخصی قرار بگیرد، برای نمونه در بازه ۱٫۹۸ تا ۲٫۰۴ کیلوگرم، از صفر بیشتر است و این مسئله در نمودار نیز قابل نمایش است، به این صورت که در نمودار تابع چگالی احتمال این بخش را با سایه مشخص میکنیم (شکل بالا). در واقع اگر بازه وزنی ۱٫۹۸ تا ۲٫۰۴ کیلوگرم را روی محور افقی مشخص کنیم و آن را در راستای قائم امتداد دهیم تا به منحنی برسیم، سطح موردنظرمان ساخته شده است. این ناحیه سایهدار یا رنگشده مساحتی به اندازه ۰٫۰۹ دارد، به این معنا که احتمالی برابر با عدد ۰٫۰۹ وجود دارد که یک آناناس، وزنی بین ۱٫۹۸ و ۲٫۰۴ کیلوگرم داشته باشد. محاسبه مساحت این ناحیه با نرمافزارهای آماری انجام میشود.
معرفی چند توزیع احتمال پیوسته
در مثال قبل دیدیم که متغیر پیوستهای مانند وزن آناناس از توزیع احتمالی به نام توزیع نرمال پیروی میکرد. در این بخش ابتدا چند توزیع احتمال پیوسته معروف را معرفی میکنیم و سپس هر کدام را بهصورت مختصر همراه با مثال توضیح خواهیم داد:
- توزیع احتمال پیوسته نرمال
- توزیع احتمال پیوسته یکنواخت
- توزیع احتمال پیوسته «لاگ - نرمال» (Log-normal)
- توزیع احتمال پیوسته نمایی
همچنین خواهید دید که معادلات ریاضیاتی حاکم بر توابع چگالی احتمال این نوع توزیع احتمال چیست.
توزیع احتمال نرمال چیست؟
احتمالا در مبحث توزیع احتمال با نمودارهایی شبیه یک زنگ برعکس شده زیاد مواجه شدهاید. در این قسمت یاد میگیریم که معادله ریاضیاتی حاکم بر این نوع توزیع احتمال چیست. توزیع احتمال نرمال دادههایی را توصیف میکند که با دور شدن از مقدار میانگین، احتمال کمتری برای رخ دادن آنها وجود دارد. تابع چگالی احتمال برای توزیع احتمال پیوسته نرمال شبیه یک زنگ (bell-shaped) است. فرمول تابع چگالی احتمال برای توزیع احتمال نرمال بهصورت زیر است:
توزیع احتمال یکنواخت پیوسته چیست؟
میخواهیم ببینیم تعریف نوع یکنواخت پیوسته برای یک توزیع احتمال چیست. توزیع یکنواخت هم برای متغیرهای پیوسته وجود دارد و هم برای متغیرهای گسسته. پس باید دقت کنید که با هم اشتباه نشوند. این نوع توزیع، دادههایی را که برای آنها فواصل هم اندازه احتمال برابری دارند، نمایش میدهد. برای مثال مدت زمان انتظار ماشینها برای چراغ قرمز. همچنین تابع PDF این نوع توزیع، فرمول ریاضی به شکل زیر خواهد داشت:
توزیع احتمال لاگ - نرمال چیست؟
توزیع احتمال پیوسته لاگ - نرمال دادههایی با خمیدگی یا چولگی به سمت راست را توصیف میکند. به عبارت دیگر، متغیر تصادفی که لگاریتم آن بهصورت نرمال توزیع شده است، توسط این نوع توزیع نمایش داده میشود. برای نمونه، متوسط وزن بدن در گونههای مختلف پستانداران.
توزیع احتمال نمایی چیست؟
در معرفی آخرین مورد از انواع توزیعهای احتمال پیوسته، یاد میگیریم که نوع نمایی توزیع احتمال چیست. در توزیع احتمال نمایی، برای مقادیر کوچک نسبت به مقادیر بزرگ احتمال بالاتری در نظر گرفته میشود و معادل است با توزیع احتمال زمانی بین رویدادهای مستقل، برای مثال مدت زمان بین زمینلرزهها. اگر بخواهیم برای تابع چگالی احتمال توزیع نمایی فرمولی بنویسیم، بهصورت زیر خواهد بود:
تابع توزیع احتمال چیست؟
با توجه به آنچه که در بخشهای قبل گفته شد، احتمالا تا الان متوجه شدهاید که تابع توزیع احتمال چیست و چه انواعی دارد. در توزیع احتمال، نتیجه یک متغیر تصادفی مشخص نیست. اگر مشاهده نتیجه را معادل محقق شدن در نظر بگیریم، میتوانیم این مفهوم را تابعی تعریف کنیم که فضای نمونه را به فضای اعداد حقیقی نگاشت میکند.
توزیع احتمال پیوسته | توزیع احتمال گسسته |
تابع چگالی احتمال یا PDF | تابع جرم احتمال یا PMF |
محاسبات: انتگرالگیری | محاسبات: شمارش، مجموع یا تناسبگیری |
به خاطر داریم که فضای اعداد حقیقی را فضای حالت مینامند که میتواند گسسته یا پیوسته باشد. بنابراین با توجه به نوع توزیع احتمال (گسسته یا پیوسته)، دو نوع تابع توزیع احتمال داریم:
- تابع توزیع احتمال گسسته، تابع جرم احتمال یا PMF نام دارد.
- تابع توزیع احتمال پیوسته، تابع چگالی احتمال یا PDF نام دارد.
پارامترهای توزیع احتمال چیست؟
متغیرهای تصادفی دارای سه ویژگی مهم به نام «میانگین» (Mean) یا «امید ریاضی» (Expected Value)، «واریانس» (Variance) و «انحراف معیار» (Standard Deviation) هستند. با شناخت این سه پارامتر، تحلیل بهتری از توزیع احتمال خواهیم داشت. بنابراین پارامترهای توزیع احتمال عبارتاند از:
- امید ریاضی (میانگین)
- واریانس
- انحراف معیار
در سه بخش بعد راجعبه این کمیتهای آماری توضیح خواهیم داد تا بهتر متوجه شوید ارتباط این مفاهیم با توزیع احتمال چیست.
امید ریاضی چیست؟
امید ریاضی نام دیگر میانگین یک متغیر تصادفی است و اغلب با (x)E یا μ برای متغیرهای پیوسته نمایش داده میشود. با انتخاب یک نمونه تصادفی از یک توزیع، انتظار این است که میانگین نمونه تقریبا برابر باشد با امید ریاضی. در مورد متغیرهای تصادفی گسسته، میانگین یا امید ریاضی برابر است با مجموع حاصلضربهای هر مقدار ممکن X در احتمالش (X)P، که توسط فرمول زیر نشان داده میشود:
علامت ∑ به معنای مجموع است. اما در مورد متغیرهای تصادفی پیوسته، محاسبه امید ریاضی با انتگرالگیری روی امکانپذیر است:
اهمیت محاسبه میانگین در یک توزیع احتمال این است که متوجه شویم میزان تمایل مرکزی متغیرمان به چه صورت است.
واریانس چیست؟
واریانس یک متغیر تصادفی را با σ۲ نشان میدهیم که نشاندهنده میزان پخششدگی آن متغیر حول میانگین است. بنابراین، واریانس پایین به معنای این است که متغیر ما تمایل دارد به مقدار مرکزی یا میانگین نزدیک باشد. در محاسبه واریانس نیز مانند محاسبه میانگین، در مورد متغیرهای پیوسته به جای محاسبه مجموع باید انتگرالگیری شود. برای محاسبه واریانس کافی است ابتدا اختلاف هر مقدار ممکن را از میانگین بهدست آوریم. سپس عدد محاسبه شده را به توان دو برسانیم و در نهایت هر کدام از اعداد را در احتمال متناظر ضرب کنیم. مجموع مقادیر بهدست آمده معادل واریانس است:
انحراف معیار چیست؟
در انتها میخواهیم ببینیم آخرین پارامتر مهم برای یک توزیع احتمال چیست. انحراف معیار یک توزیع احتمال، نشاندهنده میزان تغییرپذیری آن است و اغلب توسط σ نشان داده میشود. برای محاسبه انحراف معیار کافی است ریشه دوم یا جذر واریانس را بهدست آوریم.
روش محاسبه امید ریاضی (میانگین)
در بررسی نمودارهای PMF یا PDF، گفتیم که امکان محاسبه مقادیر میانگین دادهها وجود دارد. در این بخش میخواهیم ببینیم روش محاسبه امید ریاضی یا میانگین با داشتن توزیع احتمال چیست. برای این منظور کافی است فرمول، نمونه یا جدول احتمال آن توزیع را داشته باشیم. اولین نکته مهم برای یافتن امید ریاضی این است که بدانیم متغیرهای دو جملهای، امید ریاضی و در نتیجه انحراف معیار ندارند. در مرحله بعد، با توجه به اطلاعاتی که در اختیار دارید، به سه روش ممکن است بتوانید امید ریاضی را محاسبه کنید:
- اگر فرمول توزیع را دارید، برای مثال تابع چگالی احتمال یا PDF، در این صورت امید ریاضی با پارامتر μ نمایش داده میشود. اگر پارامتر μ وجود نداشته باشد، امید ریاضی با استفاده از پارامترهای دیگر و با بکار بردن معادلاتی که برای هر توزیع مشخص هستند، قابل محاسبه است.
- اگر نمونه دارید، در این صورت میانگین نمونه برآوردی است از امید ریاضی توزیع احتمال جامعه آماری. بنابراین هر چه اندازه نمونه بزرگتر باشد، این تخمین بهتر خواهد بود.
- اگر جدول احتمال را دارید، میتوانید امید ریاضی را با ضرب کردن هر نتیجه ممکن در احتمال آن و سپس جمع کردن این مقادیر با هم محاسبه کنید.
در مثال بخش بعد، با نحوه محاسبه امید ریاضی بیشتر آشنا خواهید شد.
مثال محاسبه امید ریاضی
بهعنوان مثالی برای محاسبه امید ریاضی، فرض کنید نوعی پرنده آمریکایی پس از هر بار تخمگذاری بین ۲ تا ۴ تخممرغ در لانه خود دارد. اگر جدول احتمال زیر، توزیع احتمال تعداد تخممرغها را به ازای هر لانه نشان دهد، امید ریاضی تخممرغها به ازای هر لانه چقدر است؟
تخممرغ | احتمال |
پاسخ
در این سوال، جدول احتمال داده شده است. پس از روش سوم استفاده میکنیم، به این صورت که ابتدا باید هر نتیجه ممکن یا را در احتمالش یا ضرب کنیم:
تخممرغ یا | احتمال یا | |
پس از اینکه مقادیر را حساب کردیم، باید آنها را با هم جمع کنیم:
به این ترتیب امید ریاضی تخممرغها به ازای هر لانه بهدست آمد.
روش محاسبه انحراف معیار
در ادامه یادگیری روشهای محاسبه کمیتهای مهم آماری، در این بخش قصد داریم توضیح دهیم روش محاسبه انحراف معیار در یک توزیع احتمال چیست. محاسبه انحراف معیار هم مانند امید ریاضی بسته به اینکه چه نوع اطلاعاتی در اختیار دارید، به سه روش امکانپذیر است:
- اگر فرمول توزیع را دارید، برای مثال تابع چگالی احتمال یا PDF، در این صورت انحراف معیار با پارامتر σ نمایش داده میشود. اگر پارامتر σ وجود نداشته باشد، انحراف معیار با استفاده از پارامترهای دیگر و با بکار بردن معادلاتی که برای هر توزیع مشخص هستند، قابل محاسبه است.
- اگر نمونه دارید، در این صورت انحراف معیار نمونه تخمینی است از انحراف معیار توزیع احتمال جامعه آماری آن. بنابراین هر چه اندازه نمونه بزرگتر باشد، تخمین بهتری خواهیم داشت.
- اگر جدول احتمال دارید، ابتدا لازم است انحراف هر مقدار از امید ریاضی را محاسبه کنید. سپس حاصل را به توان دو رسانده و در احتمالش ضرب کنید. در انتها جذر مجموع مقادیر بهدست آمده را بگیرید.
در بخش بعد با حل یک مثال، نحوه محاسبه انحراف معیار را بهتر یاد میگیرید.
مثال محاسبه انحراف معیار
مجددا مثال بخش محاسبه امید ریاضی را در نظر بگیرید که در آن نوعی پرنده آمریکایی پس از هر بار تخمگذاری بین ۲ الی ۴ تخممرغ در لانه خود داشت. اگر جدول احتمال زیر، توزیع احتمال تعداد تخممرغها را به ازای هر لانه نشان دهد، انحراف معیار تخممرغها به ازای هر لانه چقدر است؟
تخممرغ | |
پاسخ
طبق آنچه که توضیح دادیم، در این مثال هم جدول احتمال داده شده است. پس از روش سوم برای محاسبه انحراف معیار استفاده میکنیم که در آن قدم اول محاسبه انحراف میان هر مقدار و امید ریاضی است:
تخممرغ یا | احتمال یا | |
مرحله بعدی حساب کردن مربع مقادیر بهدست آمده در ستون سوم جدول بالا است. همچنین لازم است حاصل هر خانه در احتمالش ضرب شود:
تخممرغ یا | احتمال یا | |||
در آخرین مرحله کافی است تمام مقادیر ستون پنجم جدول بالا را با هم جمع کنیم و از حاصل جذر بگیریم که به شکل زیر خواهد شد:
پس انحراف معیار برای این سوال برابر با ۰٫۷ تخممرغ شد.
مثال محاسبه انحراف معیار و امید ریاضی
یک شرکت سود سالانه خود روی محصول جدیدش را به شرح زیر برآورد میکند:
- اگر سود شرکت از این محصول در سال اول ۳ میلیون تومان شود، محصول موفق بوده است.
- اگر سود شرکت از این محصول در سال اول ۱ میلیون تومان شود، محصول نسبتا موفق بوده است.
- اگر شرکت از این محصول در سال اول ۱ میلیون تومان ضرر کند، محصول ناموفق بوده است.
در کنار برآورد بالا، شرکت به هر نتیجه ممکن احتمالی بهصورت زیر را نسبت میدهد:
- احتمال موفق شدن: ۰٫۲۵
- احتمال نسبتا موفق شدن: ۰٫۴
- احتمال موفق نشدن: ۰٫۳۵
- امید ریاضی و انحراف معیار سود خالص این محصول در سال اول چقدر است؟
- اگر یک هزینه ثابت ۰٫۲ میلیون تومانی را در نظر بگیریم، مستقل از اینکه وضعیت موفقیت محصول به چه صورت است، امید ریاضی سود خالص این محصول چقدر است؟
پاسخ
در اولین قدم، سود خالص این محصول برای سال اول را (بر حسب میلیون تومان) فرض میکنیم. بنابراین میتوانیم با توجه به اطلاعات صورت سوال، جدول زیر را برای و احتمال رخ دادن آن یا رسم کنیم، به این صورت که برای مثال اگر سود شرکت یا برابر با ۳ شود، یعنی شرکت موفق بوده است که احتمال آن ۰٫۲۵ در نظر گرفته شده است. اما اگر شرکت ۱ میلیون تومان ضرر دهد، به این معنا است که سود آن یا X برابر میشود با ۱- که احتمال رخ دادن چنین اتفاقی ۰٫۳۵ است:
سود یا | |||
در این مثال در واقع با توجه به اطلاعاتی که داشتیم، جدول احتمال را رسم کردیم. با داشتن جدول احتمال، در اولین قدم برای محاسبه امید ریاضی باید هر مقدار را در احتمالش ضرب کنیم:
سود یا | ||
سپس مقادیر آخرین ستون جدول بالا را با هم جمع میکنیم تا محاسبه شود:
حالا میرویم سراغ محاسبه انحراف معیار. اولین قدم این است که اختلاف هر مقدار را با امید ریاضی پیدا کنیم:
سود یا | ||
حالا با مجذور کردن ستون سوم جدول بالا و سپس ضرب کردن هر مقدار در احتمال مربوطه خواهیم داشت:
سود یا | ||||
جذر مجموع تمام مقادیر آخرین ستون از جدول بالا برابر است با انحراف معیار:
بنابراین σ یا انحراف معیار ۱٫۵۳ میلیون تومان خواهد شد. در سوال بعدی یک هزینه ثابت دیگر هم در نظر گرفته شده است. برای محاسبه امید ریاضی در چنین شرایطی داریم:
پس با در نظر گرفتن این هزینه ثابت، امید ریاضی کاهش مییابد و برابر است با ۰٫۶ میلیون تومان.
یادگیری پیشرفته کاربردهای آمار و احتمال با فرادرس
اهمیت یادگیری انواع توزیع احتمال، کاربرد گسترده این توزیعها در یادگیری ماشین (Machine Learning)، علم داده (Data Science) و تحلیل داده (Data analysis) است. بنابراین اگر قصد دارید در سطح پیشرفتهتری به مباحث بیان شده در این نوشته مسلط شوید، پیشنهاد ما این است که ابتدا با کلیات مباحث آمار و احتمال در علوم مهندسی آشنا شوید. مشاهده این فیلمهای آموزشی از فرادرس در مسیر یادگیری مقدمات موثر است:
- فیلم آموزش تئوری احتمالات فرادرس
- فیلم آموزش مبانی احتمال حل تست کنکور ارشد فرادرس
- فیلم آموزش آمار و احتمال مهندسی با مثال های مختلف فرادرس
- فیلم آموزش آمار و احتمال مهندسی حل تمرین و تست کنکور ارشد فرادرس
- فیلم آموزش آمار و احتمالات مهندسی حل نمونه سوالات کنکور ارشد فرادرس
- فیلم آموزش رایگان مبانی احتمالات فرادرس
- فیلم آموزش رایگان متغیرهای تصادفی پیوسته فرادرس
- فیلم آموزش رایگان متغیرهای تصادفی (پ) در آمار و احتمال مهندسی (تست کنکور ارشد) فرادرس
- فیلم آموزش رایگان مسائل توزیع های گسسته و پیوسته در آمار و احتمال فرادرس
پس از اینکه کاملا به مباحث آمار و احتمال مسلط شدید، مشاهده فیلمهای آموزشی زیر از مجموعه فرادرس در زمینه کاربردهای آمار و احتمال یا یادگیری نرمافزارهای آماری به شما کمک خواهد کرد:
- مجموعه آموزش اس پی اس اس SPSS – مقدماتی تا پیشرفته فرادرس
- فیلم آموزش محاسبات آماری در اکسل Excel فرادرس
- فیلم آموزش طراحی و آنالیز داده ها با نرم افزار اوریجین پرو OriginPro فرادرس
- فیلم آموزش برنامه نویسی R و نرم افزار RStudio مقدماتی فرادرس
- فیلم آموزش آمار و کاربرد آن در مدیریت فرادرس
- فیلم آموزش آمار و احتمال در پایتون Python فرادرس
جمعبندی
در این مطلب از مجله فرادرس، توضیح دادیم توزیع احتمال چیست، چه انواعی دارد و با چه توابعی نشان داده میشود. توزیع احتمال نوعی تابع آماری است که تمام مقادیر ممکن و احتمالات را برای یک متغیر تصادفی در یک بازه داده شده توصیف میکند. این بازه به بیشترین و کمترین مقادیر ممکن محدود میشود.
همچنین نقطهای که یک مقدار ممکن در نمودار توزیع احتمال به خود اختصاص میدهد، توسط فاکتورهای دیگری مانند میانگین، واریانس و انحراف معیار آن توزیع احتمال قابل تشخیص است. تمام توزیعهای احتمال با توجه به نوع متغیر تصادفی، در دو گروه قرار میگیرند. در جدول زیر خلاصهای از تفاوتها و ویژگیهای دو نوع توزیع احتمال بیان شده است:
انواع توزیع احتمال | توزیع احتمال گسسته | توزیع احتمال پیوسته |
بازه مقادیر ممکن | فقط مجموعه خاصی از مقادیر را میپذیرد. | هر مقدار از یک بازه داده شده را شامل میشود. |
تابع توزیع احتمال | تابع جرم احتمال یا PMF | تابع چگالی احتمال یا PDF |
مجموع احتمالات | همواره برابر با یک است. | قابل محاسبه نیست. |