توزیع احتمال چیست؟ – توضیح به زبان ساده با مثال

۲۰۳ بازدید
آخرین به‌روزرسانی: ۷ مهر ۱۴۰۳
زمان مطالعه: ۳۲ دقیقه
توزیع احتمال چیست؟ – توضیح به زبان ساده با مثال

«توزیع احتمال» (Probability Distribution) یکی از مهم‌ترین مفاهیم آماری است و یادگیری آن، به ما کمک می‌کند تا رفتار متغیرهای تصادفی را بهتر متوجه شویم. توزیع احتمال تابعی است که برای توصیف احتمال رخ‌دادن تمام نتایج ممکن در یک آزمایش بکار می‌رود و با توجه به نوع متغیر تصادفی، ممکن است پیوسته یا گسسته باشد. در این مطلب از مجله فرادرس پس از اینکه توضیح دادیم توزیع احتمال چیست، با انواع مختلف توزیع‌های احتمال آشنا می‌شوید. سپس یاد می‌گیرید تابع توزیع احتمال مربوط به هر نوع توزیع چه نام دارد و روش محاسبه پارامترهای توزیع احتمال چگونه است. پیشنهاد می‌کنیم برای درک بهتر هر مبحث، حتما مثال‌های مرتبط را مطالعه کنید.

فهرست مطالب این نوشته
997696

توزیع احتمال چیست؟

یک متغیر تصادفی ممکن است مقادیر مختلفی داشته باشد. فرض کنید برای امکان رخ دادن هر کدام از این مقادیر ممکن، یک احتمال در نظر بگیریم. در این صورت تابع ریاضی که برای توصیف این احتمالات بکار می‌رود، توزیع احتمال نام دارد. بنابراین توزیع احتمال یک متغیر تصادفی نشان می‌دهد که چگونه احتمالات رویدادهای مختلف روی مقادیر مختلفی از این متغیر توزیع شده‌اند. یک توزیع احتمال ویژگی‌های مختلفی دارد که قابل اندازه‌گیری است، مانند امید ریاضی و انحراف معیار. معمولا برای نشان دادن توزیع احتمال از نمودار یا جدول احتمال استفاده می‌شود.

تصویری از ساحل و نحوه توزیع انسان‌ها

انواع توزیع‌های احتمال‌ که در بررسی مسائل مختلف آماری بیشترین کاربرد را دارند، عبارت‌اند از:

این گروه از توزیع‌های احتمال را توزیع‌های احتمال گسسته یا Discrete می‌نامند. از طرفی انواع دیگری از توزیع‌های احتمال را داریم که بیشتر با هدف سنجش فرضیات استفاده می‌شوند. این گروه توزیع‌های احتمال پیوسته یا Continuous نامیده می‌شوند که شامل موارد زیر است:

در تصویر زیر چند نمونه از انواع توزیع‌های احتمال نشان داده شده است. اگر دقت کنید شکل نمودار در مورد توزیع‌های ردیف بالا که در گروه توزیع‌های احتمال پیوسته قرار دارند، به‌صورت یک منحنی پیوسته است. اما در ردیف پایین و برای توزیع‌های احتمال گسسته، نمودارها به‌صورت مقادیری مجزا و تفکیک شده و شبیه چند نمودار میله‌ای با شکل‌های مختلف هستند.

یک جدول سبز رنگ همراه با چند نمودار - توزیع احتمال چیست؟
انواع توزیع‌های احتمال (برای مشاهده تصویر در ابعاد بزرگ‌تر، روی آن کلیک کنید)

کاربرد توزیع‌های احتمال در توصیف جامعه آماری متغیرهایی است که در زندگی واقعی با آن‌ها سروکار داریم. همچنین به منظور آزمودن برخی فرضیات نیز از توزیع‌های احتمال خاصی استفاده می‌شود تا «مقدار احتمال» (p-value) تعیین شود. پیش از اینکه به بررسی جنبه‌های مختلف توزیع احتمال بپردازیم، بهتر است ابتدا در مورد مفاهیم پایه‌ای مانند تعریف احتمال و متغیر تصادفی صحبت کنیم. تسلط کامل به این دو مبحث به شما کمک می‌کند تا بهتر متوجه شوید که یک توزیع احتمال چیست.

احتمال چیست؟

در بخش قبل تا حدی متوجه شدیم که توزیع احتمال چیست. در این بخش قصد داریم توضیح دهیم که احتمال چیست. احتمال یک مفهوم ریاضیاتی است که شانس رخ دادن یک اتفاق را با عددی بین ۰ و ۱ به ما نشان می‌دهد تا بتوانیم آن را اندازه‌گیری کنیم و در نهایت بر این اساس، پیش‌بینی انجام دهیم.

خط بنفش و دو پیکان نارنجی
مفهوم صفر و یک در احتمال (برای مشاهده تصویر در ابعاد بزرگ‌تر، روی آن کلیک کنید)

احتمال صفر به معنای این است که احتمال رخ دادن یک اتفاق صفر است، در حالی که احتمال یک به معنای قطعیت کامل در رخ دادن آن اتفاق است. اگر احتمال برابر با عدد بزرگ‌تری شود، به این معنا است که فراوانی مقدار موردنظر ما در نمونه بیشتر است. اگر بخواهیم دقیق‌تر بیان کنیم، احتمال وقوع یک مقدار معادل فراوانی نسبی آن مقدار در یک نمونه بی‌نهایت بزرگ است. البته نمونه‌های بی‌نهایت بزرگ در زندگی واقعی نمود عینی ندارند و به همین دلیل است که توزیع‌ احتمال یک نظریه است.

مسیر یادگیری آمار و احتمال با فرادرس

در بخش اول تا حدی متوجه شدیم که توزیع احتمال چیست و چه انواعی دارد. اگر دانش‌آموز هستید، در این قسمت قصد داریم با توجه به فیلم‌های آموزشی تهیه شده در مجموعه فرادرس، به شما یک مسیر یادگیری در زمینه آمار و احتمال پیشنهاد کنیم.

تصویری از مجموعه آموزش ریاضی متوسطه دوم در فرادرس
برای دسترسی به مجموعه فیلم آموزش ریاضی متوسطه دوم در فرادرس، روی تصویر کلیک کنید.

چنانچه در رشته علوم انسانی مشغول به تحصیل هستید، مشاهده فیلم‌های آموزشی زیر به شما در یادگیری مفاهیمی مانند آمار توصیفی، احتمال و توزیع‌های احتمالاتی کمک می‌کند:

  1. فیلم آموزش ریاضی و آمار دهم انسانی فرادرس
  2. فیلم آموزش ریاضی و آمار دهم حل سوالات کنکور فرادرس
  3. فیلم آموزش ریاضی و آمار دوازدهم انسانی فرادرس
  4. فیلم آموزش ریاضی و آمار دوازدهم حل سوالات کنکور فرادرس

اما اگر در رشته‌های ریاضی یا علوم تجربی در حال تحصیل هستید، می‌توانید به لیست زیر برای مشاهده فیلم‌های آموزشی با موضوع آمار و احتمال مراجعه کنید:

  1. فیلم آموزش ریاضی دهم تجربی و ریاضی فرادرس
  2. فیلم آموزش ریاضی یازدهم تجربی فرادرس
  3. فیلم آموزش ریاضی دوازدهم تجربی فرادرس
  4. فیلم آموزش آمار و احتمال پایه یازدهم فرادرس

متغیر تصادفی چیست؟

برای اینکه بهتر یاد بگیرید توزیع احتمال چیست، دانستن معنای یکی دیگر از مفاهیم مهم آماری به نام «متغیر رندوم یا تصادفی» (Random Variables) ضروری است. اما پیش از آن، در ابتدای این بخش، فیلم آموزشی ریاضی و آمار ۱ رشته علوم انسانی فرادرس را به شما معرفی می‌کنیم که در آن انواع متغیرها و مقیاس‌های اندازه‌گیری آن‌ها در دو فصل آخر کتاب درسی ریاضی و آمار پایه دهم آموزش داده می‌شود. با مشاهده این فیلم به مفاهیم پایه کاملا مسلط خواهید شد. در ادامه لینک این آموزش برای شما قرار داده شده است:

خطوطی از یک منحنی بسته سبز
یک متغیر تصادفی تابعی با مقدار حقیقی است که دامنه آن، فضای نمونه یک آزمایش تصادفی است.

هر متغیری که مقدار آن به یک آزمایش شانسی یا تصادفی بستگی داشته باشد، متغیر تصادفی نامیده می‌شود. این متغیر تابعی با مقدار حقیقی است که دامنه آن، فضای نمونه آزمایش تصادفی است. برای نمایش متغیر تصادفی معمولا از حروف لاتین بزرگ مانند X یا Y یا Z استفاده می‌شود. نحوه نمایش متغیر تصادفی X با توجه به تعریفی که ارائه شد، به شکل زیر است:

عدد حقیقی = (فضای نمونه)X

همان‌طور که در شکل بالا مشاهده می‌کنید، متغیر تصادفی X تابعی است که یک عدد حقیقی را به یک رویداد مربوط می‌کند. این جمله به معنی نسبت دادن هر نتیجه ممکن به یک مقدار (عدد حقیقی) است. انتخاب متغیر تصادفی ما بر اساس نیازمان، ممکن است به شکل‌های مختلفی انجام شود.

سه بیضی با رنگ آبی در کنار هم به‌صورت یک نمودار
متغیر تصادفی گسسته در مثال پرتاب یک سکه (برای مشاهده تصویر در ابعاد بزرگ‌تر، روی آن کلیک کنید)

فرض کنید می‌خواهیم ببینیم نتیجه پرتاب یک سکه چه خواهد شد. متغیر تصادفی خود را برای این آزمایش تصادفی به این شکل انتخاب می‌کنیم که اگر سکه رو بیاید، عدد حقیقی متناظر با متغیر تصادفی X برابر است با ۱، در حالی که اگر سکه زیر بیاید، X=0X=0. پس متغیر تصادفی X دارای دو مقدار ممکن است، ۰ یا ۱ که بسته به نتیجه آزمایش تصادفی، یکی از این دو مقدار را خواهیم داشت.

برای نمایش مقادیر ممکن X، می‌توانیم از توزیع احتمال استفاده کنیم. این توزیع به ما می‌گوید که احتمال رخ دادن هر مقدار ممکن چقدر است. برای نمونه، توزیع احتمال برای مثال پرتاب سکه به شکل زیر خواهد شد، چون احتمال رو یا زیر آمدن سکه در هر بار پرتاب برابر است با ۱/۲:

P(X=0)=12P(X=0)=\frac{1}{2}

P(X=1)=12P(X=1)=\frac{1}{2}

انواع متغیرهای تصادفی چه هستند؟

پس از اینکه با مفهوم متغیر تصادفی آشنا شدیم، لازم است انواع متغیر تصادفی را بشناسیم تا بتوانیم تشخیص دهیم انواع توزیع احتمال چیست. اگر بخواهید متغیر تصادفی را که بیان‌گر قد اولین شخصی است که وارد اتاق می‌شود، در نظر بگیرید، در واقع یک متغیر تصادفی پیوسته را انتخاب کرده‌اید. چون قد شخص ممکن است ۱۶۰ سانتی‌متر یا ۱۶۰٫۲ سانتی‌متر باشد و به‌ عبارت دیگر، قد شخص یک عدد صحیح نیست.

چند تاس با رنگ‌های مختلف

اما متغیر تصادفی که نشان دهد اعداد به‌دست آمده در تاس انداختن کدام هستند، یک متغیر تصادفی گسسته است. چون در هر بار تاس انداختن یک عدد صحیح از ۱ تا ۶ خواهیم داشت و برای مثال با عددی مثل ۵٫۳ مواجه نخواهیم شد. پس متغیرهای تصادفی دو نوع‌ هستند:

  • متغیر تصادفی پیوسته: بازه یک متغیر تصادفی پیوسته شامل مجموعه غیرقابل‌شمارشی از اعداد است، طوری که نمی‌توان آن‌ها را از هم تفکیک کرد.
  • متغیر تصادفی گسسته: بازه یک متغیر تصادفی گسسته شامل یک مجموعه گسسته یا تفکیک‌شده از اعداد است.

برای مثال فرض کنید یک سکه را ۵ مرتبه پرتاب می‌کنیم. حالا اگر در این آزمایش متغیر تصادفی را به‌صورت تعداد دفعات رو آمدن سکه تعریف کنیم، در این صورت متغیر تصادفی ما می‌تواند مقادیری به‌صورت ۰، ۱، ۲، ۳، ۴ یا ۵ را بپذیرد. بنابراین در اینجا متغیر تصادفی از نوع گسسته است. در مثال‌ زیر بهتر مشخص می‌شود چرا نیاز داریم مفهوم متغیر تصادفی را یاد بگیریم. همچنین روند بررسی مسائل آمار و احتمال و ساخت فضای نمونه را بهتر متوجه خواهید شد.

بررسی متغیر تصادفی در مثال پرتاب سکه

فرض کنید می‌خواهیم پس از ۲ مرتبه پرتاب یک سکه، به سوالات زیر پاسخ دهیم:

  • احتمال اینکه دقیقا هر ۲ بار رو بیاوریم، چقدر است؟
  • احتمال اینکه فقط یک بار رو بیاوریم، چقدر است؟
تصویری از شخصی که آماده پرتاب سکه است.

در پرتاب یک سکه دو حالت ممکن است اتفاق بیفتد، یا ممکن است پشت سکه را ببینیم، که این احتمال را با T نشان می‌دهیم و یا ممکن است روی سکه را مشاهده کنیم، که این احتمال را با H نشان می‌دهیم. طبق سوال ۲ مرتبه پرتاب سکه داریم. پس چهار حالت ممکن است اتفاق بیفتد:

  1. HH: در هر دو پرتاب رو بیاید.
  2. HT: در پرتاب اول رو و در پرتاب دوم زیر بیاید.
  3. TH: در پرتاب اول زیر و در پرتاب دوم رو بیاید.
  4. TT: در هر دو پرتاب زیر بیاید.

به این ترتیب فضای نمونه یا S برای این آزمایش را به شکل زیر می‌نویسیم:

S={HH,HT,TH,TT}S=\left\{HH, HT, TH ,TT\right\}

حالا باید متغیر تصادفی X را بر اساس سوال انتخاب کنیم، به گونه‌ای که تعداد دفعات زیر یا رو را طبق خواسته ما بشمارد. انتخاب ما این است:

متغیر تصادفی X برابر است با تعداد دفعاتی که سکه رو می‌آید.

پس برای هر نتیجه، مقدار متغیر تصادفی به‌صورت زیر خواهد شد:

X(HH)=2X(HH)=2

X(HT)=1X(HT)=1

X(TH)=1X(TH)=1

X(TT)=0X(TT)=0

برای پاسخ به اولین سوال، باید ببینیم چند بار مقدار عددی X برابر با ۲ شده است. طبق روابط بالا، این اتفاق از چهار امکانی که داریم فقط یک بار رخ ممکن است دهد. پس از فرمول احتمال به شکل زیر استفاده می‌کنیم:

P(X=2)=n(X=2)n(S)P(X=2)=\frac{n(X=2)}{n(S)}

  • P(X=2)P(X=2): احتمال اینکه دو بار سکه رو بیاید.
  • n(X=2)n(X=2): تعداد مقادیر X=2X=2
  • n(S)n(S): تعداد مقادیر فضای نمونه یا S
یک نمودار میله‌ای
تابع احتمال (X)P برای متغیر تصادفی گسسته X

با توجه به تعریف‌های بالا n(S)=4n(S)=4 است و n(X=2)=1n(X=2)=1. بنابراین احتمال P(X=2)P(X=2) می‌شود:

P(X=2)=14P(X=2)=\frac{1}{4}

برای پاسخ به سوال بعدی، باید ببینیم چند بار X=1X=1 داشته‌ایم که می‌شود:

n(X=1)=2n(X=1)=2

در نتیجه احتمال برای سوال دوم خواهد شد:

P(X=1)=24=12P(X=1)=\frac{2}{4}=\frac{1}{2}

 دقت کنید ممکن است به مقادیر متغیر تصادفی یکسان، بیشتر از یک رویداد نسبت داده شود. مثلا در روابط بالا، برای X=1X=1 دو نوع رویداد مختلف داشتیم.

توزیع فراوانی چیست؟

از آنجا که توزیع احتمال در واقع یک توزیع فراوانی ایده‌آل است، در این بخش به توضیح «توزیع فراوانی» (Frequency Distribution) می‌پردازیم تا ببینیم ارتباط آن با توزیع احتمال چیست. توزیع فراوانی برای توصیف یک نمونه خاص یا یک مجموعه داده بکار می‌رود و به معنای تعداد دفعات رخ دادن هر مقدار ممکن برای هر متغیر در یک مجموعه داده است.

توزیع‌های احتمال نوع ایده‌آل توزیع‌های فراوانی در نظر گرفته می‌شوند تا بتوانند جامعه‌ای که نمونه از آن استخراج می‌شود را توصیف کنند. در واقع تفاوت توزیع فراوانی با توزیع احتمال در این است که توزیع احتمال نه‌تنها نشان می‌دهد که تعداد نتیجه‌های ممکن چقدر است، بلکه به هر نتیجه احتمالی را نیز نسبت می‌دهد. این احتمالات نشان می‌دهند که احتمال رخداد هر نتیجه چقدر است. بنابراین توزیع احتمال اطلاعات بیشتری به ما می‌دهد، هرچند که برای تشخیص توزیع احتمال بهتر است توزیع فراوانی را ابتدا بدانیم. مثال بخش بعد به شما کمک می‌کند تا کاملا متوجه شوید چگونه می‌توان از توزیع فراوانی به توزیع احتمال رسید و پیش‌بینی احتمالاتی دقیق‌تری برای حل مسئله ارائه کرد.

مثال ارتباط توزیع فراوانی و توزیع احتمال

در این بخش با بررسی یک مثال عددی بهتر درک خواهید کرد که ارتباط توزیع فراوانی با توزیع احتمال چیست. همچنین متوجه خواهید شد که معنای جمله «توزیع‌های احتمال همان توزیع‌های فراوانی ایده‌آل هستند» چیست. می‌خواهیم نشان دهیم که چگونه می‌توان پس از رسم هیستوگرام توزیع فراوانی با کاربرد توزیع احتمال، به یک برآورد دقیق‌تر رسید. فرض کنید مزرعه‌داری یک آناناس را به‌صورت تصادفی انتخاب ‌می‌کند و می‌خواهد به سوال زیر پاسخ دهد:

احتمال اینکه این ‌آناناس دارای وزن خاصی (مثلا ۱٫۸ کیلوگرم) باشد، چقدر است؟

برای پاسخ به سوال بالا، لازم است ابتدا مزرعه‌دار تعداد ۱۰۰ عدد آناناس را به شکل تصادفی انتخاب کرده و هر کدام را وزن کند. با نوشتن وزن هر کدام، مشاهده می‌کند که برای مثال ممکن است ۱۵ عدد آناناس وزنی برابر با ۱٫۶ کیلوگرم داشته باشند، این یعنی فراوانی وزن ۱٫۶ کیلوگرم می‌شود ۱۵. بنابراین پس از بررسی فراوانی وزن‌های مختلف، می‌توان برای نمایش توزیع فراوانی وزن این ۱۰۰ عدد آناناس، یک هیستوگرام به شکل زیر رسم کرد:

  • محور افقی: وزن آناناس‌ (بر حسب کیلوگرم)
  • محور عمودی: فراوانی مقادیر وزن
نمودار ستونی با رنگ بنفش
هیستوگرام توزیع فراوانی وزن آناناس

با توجه به این هیستوگرام، مزرعه‌دار می‌تواند به این نتیجه برسد که احتمال رخ دادن وزن‌های مختلف برای هر آناناس انتخابی چقدر است. مثلا احتمال اینکه یک آناناس وزنی حدود ۱٫۹ کیلوگرم داشته باشد، نسبت به اینکه وزنی بیشتر از ۲٫۱ کیلوگرم داشته باشد، خیلی بیشتر است.

حالا فرض کنید مزرعه‌دار می‌خواهد برآوردهای احتمالاتی دقیق‌تری داشته باشد. یک روش برای رسیدن به این پیش‌بینی دقیق‌تر این است که به‌جای ۱۰۰ عدد آناناس، تعداد خیلی بیشتری را وزن کند. اما راه‌حل بهتر این است که با توجه به شکل هیستوگرام رسم شده، تشخیص دهد که وزن ‌آناناس‌ها از کدام نوع توزیع احتمال پیروی می‌کنند.

نموداری با یک قله
نمودار توزیع فراوانی وزن آناناس

در این مثال، توزیع فراوانی از توزیع احتمال معروفی به نام توزیع نرمال پیروی می‌کند که نمودار آن به شکل بالا است. در نتیجه مزرعه‌دار با فرض اینکه وزن آناناس‌ها به‌صورت نرمال توزیع شده‌اند، می‌تواند یک ورژن ایده‌آل‌تر از توزیع فراوانی بالا را برای بررسی در نظر بگیرد. از آنجایی که توزیع‌های نرمال توسط متخصصین آمار خیلی خوب درک می‌شوند، مرزعه‌دار می‌تواند با کمک گرفتن از آن‌ها تخمین‌ احتمالاتی دقیق‌تری داشته باشد. در بخش‌های بعد یاد می‌گیریم که چگونه پارامترهای توزیع احتمال را محاسبه کنیم تا بتوانیم برآورد دقیق‌تری از وضعیت جامعه آماری خود داشته باشیم.

نحوه نمایش توزیع احتمال

پس از اینکه متوجه شدیم متغیر موردنظرمان از کدام توزیع احتمال پیروی می‌کند، باید بدانیم نحوه نمایش این توزیع احتمال چیست. متغیرهایی که از یک توزیع احتمال پیروی می‌کنند، همان متغیر‌های رندوم یا تصادفی هستند. به عبارت دیگر، متغیرهای تصادفی از یک توزیع مشخص پیروی می‌کنند. حالا اگر بخواهیم این جمله را با عبارت‌های ریاضی نشان دهیم، به این صورت عمل می‌کنیم:

  1. متغیرهای تصادفی را با X نشان می‌دهیم.
  2. برای مشخص کردن اینکه این متغیر تصادفی از یک توزیع پیروی می‌کند، از علامت ∼ استفاده می‌کنیم.
  3. توزیعی که متغیر تصادفی از آن پیروی می‌کند، معمولا با یک حرف لاتین بزرگ نمایش داده می‌شود و معمولا این حرف، اولین حرف نام آن توزیع است (برای مثال، توزیع نرمال را با N نشان می‌دهیم).
  4. در کنار این حرف، از یک پرانتز برای نشان دادن پارامترهای توزیع استفاده می‌شود (برای نمونه، میانگین و واریانس پارامترهای توزیع نرمال محسوب می‌شوند).

در نتیجه عبارت زیر بیان‌گر این است که برای مثال، متغیر تصادفی X از یک توزیع نرمال با میانگین μ و واریانس σ۲ پیروی می‌کند:

XN(μ,σ2)X \sim N(\mu,\sigma^2)

انواع توزیع احتمال چیست؟

پس از اینکه یاد گرفتیم نحوه نمایش توزیع احتمال چیست، لازم است با انواع توزیع‌های احتمال بیشتر آشنا شویم. یکی از انواع تقسیم‌بندی‌های توزیع احتمال بر اساس نوع متغیر (گسسته یا پیوسته) است. با توجه به اینکه متغیر موردنظر گسسته است یا پیوسته، دو نوع توزیع احتمال داریم:

  • توزیع‌های احتمال گسسته
  • توزیع‌های احتمال پیوسته
یک نمودار میله‌ای سبز و یک منحنی سبز
انواع توزیع‌ احتمال

در ادامه ویژگی‌های هر کدام از این توزیع‌ها را بیشتر توضیح می‌دهیم و برای هر کدام، یک تابع توزیع احتمال تعریف می‌کنیم. همچنین با معادلات ریاضی مربوط به چند توزیع احتمال معروف آشنا خواهید شد.

توزیع احتمال گسسته چیست؟

می‌خواهیم ببینیم نوع گسسته توزیع احتمال چیست. توزیع احتمال گسسته به توزیع احتمال متغیرهای گسسته یا «متغیرهای رسته‌ای یا طبقه‌‌ای» (Categorical Variables) گفته می‌شود. توزیع‌های احتمال گسسته فقط شامل احتمالات مقادیر ممکن هستند، یعنی یک توزیع احتمال گسسته شامل مقادیری با احتمال صفر نیست. نمودار زیر نشان می‌دهد که در آزمایش تصادفی ۱۰ مرتبه پرتاب یک سکه، توزیع احتمال تعداد دفعات رو آمدن سکه چه شکلی دارد.

تصویری از یک نمودار میله‌ای و دختری با لباس زرد در حال پرتاب یک سکه
نمودار توزیع احتمال گسسته برای پرتاب سکه (برای مشاهده تصویر در ابعاد بزرگ‌تر، روی آن کلیک کنید)

به‌عنوان مثال دیگر، توزیع احتمال ریختن تاس را در نظر بگیرید که هیچ گاه شامل مقدار ۲٫۵ نیست، چون این نتیجه برای ریختن تاس ممکن نیست. پس توزیع احتمالی که برای ریختن تاس در نظر می‌گیریم، یک توزیع احتمال گسسته است. مجموع احتمالات تمام مقادیر ممکن در یک توزیع احتمال گسسته باید برابر با یک شود و قاطعانه می‌توانیم بگوییم که در هر مشاهده، یکی از مقادیر ممکن را خواهیم داشت. توزیع‌های احتمال گسسته با استفاده از جداول احتمال و «توابع جرم احتمال» (Probability Mass Functions) یا PMF‌ها توصیف می‌شوند که در ادامه هر کدام را شرح می‌دهیم.

جدول احتمال چیست؟

در این قسمت یاد می‌گیریم که ارتباط جداول احتمال با توزیع احتمال چیست. گفتیم یکی از راه‌های توصیف یک توزیع احتمال گسسته این است که از جداول احتمال استفاده کنیم. به‌طور دقیق‌تر، برای نمایش توزیع احتمال گسسته یک متغیر طبقه‌ای یا یک متغیر گسسته، از جدول احتمال استفاده می‌شود. این جدول علاوه‌ بر اینکه برای نمایش یک متغیر گسسته با تعداد محدودی از مقادیر ممکن بکار می‌رود، جهت توصیف متغیرهای پیوسته‌ای که با فاصله طبقات گروه شده‌اند، نیز استفاده می‌شوند. یک جدول احتمال شامل دو ستون است:

  1. مقادیر یا فواصل طبقات
  2. احتمالات آن‌ها

در بخش بعد در قالب یک مثال، هم نمونه‌ای از توزیع احتمال گسسته برای یک متغیر گسسته را مشاهده می‌کنید و هم با نحوه نمایش این توزیع به کمک یک جدول احتمال آشنا خواهید شد.

مثال نمایش توزیع احتمال گسسته با جدول احتمال

در این مثال نمونه‌ای از یک جدول احتمال را با هم بررسی می‌کنیم تا بهتر متوجه شوید که یکی از روش‌های نمایش توزیع احتمال چیست. فرض کنید یک ربات طوری طراحی شده است که به‌‌صورت تصادفی با مردم به شکل‌های مختلفی احوالپرسی می‌کند. توزیع احتمال گسسته نحوه احوالپرسی را با جدول احتمال زیر نشان می‌دهیم که در آن نحوه احوالپرسی، متغیر گسسته ما است:

نحوه احوالپرسیاحتمال
حال شما چطور است؟0.60.6
سلام0.10.1
خوب هستید؟0.20.2
روز خوبی داشته‌اید؟0.10.1

اگر دقت کنید هر احتمال دارای مقداری بزرگتر از صفر است و مجموع تمام احتمالات هم برابر با یک است:

0.6+0.1+0.2+0.1=10.6+0.1+0.2+0.1=1

تابع جرم احتمال (PMF) چیست؟

تا اینجا آموختیم که اگر متغیر موردنظرمان گسسته باشد، روش نمایش توزیع احتمال چیست. حالا اگر بخواهیم نمایش ریاضیاتی خاصی برای توزیع این متغیر تصادفی گسسته در نظر بگیریم، از تابع جرم احتمال یا PMF استفاده می‌کنیم. PMF احتمال وقوع هر مقدار ممکن از یک متغیر را می‌دهد. تابع جرم احتمال به شکل یک معادله ریاضی یا یک نمودار می‌تواند بیان شود. در مثال زیر، بهتر متوجه نحوه نمایش این تابع خواهید شد.

مثال نمایش توزیع احتمال گسسته با تابع جرم احتمال

در این مثال نشان می‌دهیم که روش نمایش تابع جرم احتمال برای توصیف یک توزیع احتمال چیست. فرض کنید تعداد ژاکت‌ها به ازای هر شخص در آمریکا، از توزیع احتمالی به نام توزیع پواسون پیروی کند. گفتیم برای توصیف این توزیع می‌توانیم از تابع جرم احتمال در قالب یک معادله ریاضی یا یک نمودار استفاده کنیم. PMF توزیع پواسون با معادله ریاضی زیر مشخص می‌شود:

P(X=k)=eλλkk!P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

که در آن P(X=k)P(X=k) احتمال این است که هر شخص دقیقا k ژاکت داشته باشد. λ به معنای تعداد میانگین ژاکت‌ها به ازای هر نفر است. همچنین می‌دانیم e ثابت اویلر است و تقریبا برابر است با ۲٫۷۱۸. تابع جرم احتمال بالا را می‌توان با نموداری به شکل زیر هم نمایش داد:

منحنی که از اتصال نقاط به هم رسم شده است.
نمودار تابع جرم احتمال (PMF) برای توزیع احتمال پواسون تعداد ژاکت‌ها

توجه کنید که طبق شکل بالا، هر متغیر می‌تواند تنها مقادیر مشخصی را بپذیرد که با دایره توپر در شکل نشان داده شده‌ است. این نشان می‌دهد که متغیر ما یا همان تعداد ژاکت‌ها، یک متغیر گسسته است. بنابراین هر نفر می‌تواند تعداد ۲ یا ۱۰ ژاکت داشته باشد، اما ممکن نیست ۳٫۸ عدد ژاکت داشته باشد! همچنین از گراف بالا می‌توان نتیجه گرفت که احتمال اینکه یک شخص هیچ ژاکتی نداشته باشد برابر است با ۰٫۰۵. این در حالی است که احتمال داشتن ۱ عدد ژاکت برابر است با ۰٫۱۵ و به همین ترتیب. اگر تمام احتمالات ممکن برای هر تعداد ژاکت ممکن به ازای یک شخص را با هم جمع کنید، برابر با یک خواهد شد.

تابع جرم احتمال در مثال پرتاب سکه

تا اینجا آموختیم که توزیع احتمال برای یک متغیر تصادفی گسسته تابع جرم احتمال نامیده می‌شود. در واقع PMF بیان‌گر احتمالی است که متغیر تصادفی یک مقدار خاص را می‌پذیرد. فرض کنید متغیر تصادفی X تعداد دفعاتی را نشان می‌دهد که در ۳ مرتبه پرتاب سکه رو می‌بینیم. می‌خواهیم ببینیم PMF برای X به چه صورت است.

فرض کنید احتمال دیدن پشت یا زیر سکه را با T نشان دهیم و احتمال دیدن روی آن را با H. به روشی که در مثال بخش متغیر تصادفی توضیح دادیم، عمل می‌کنیم. پس اولین کار این است که فضای نمونه را تشخیص دهیم. چون ۳ مرتبه پرتاب سکه داریم، پس هشت حالت ممکن است اتفاق بیفتد (23=82^3=8):

  1. HHH: در هر سه پرتاب رو بیاید.
  2. HTT: در پرتاب اول رو و در دو پرتاب دیگر زیر بیاید.
  3. THH: در پرتاب اول زیر و در دو پرتاب دیگر رو بیاید.
  4. HHT: در دو پرتاب اول رو و در پرتاب سوم زیر بیاید.
  5. TTH: در دو پرتاب اول زیر و در پرتاب سوم رو بیاید.
  6. HTH: در پرتاب اول رو، پرتاب دوم زیر و در پرتاب سوم رو بیاید.
  7. THT: در پرتاب اول زیر، پرتاب دوم رو و در پرتاب سوم زیر بیاید.
  8. TTT: در هر سه پرتاب زیر بیاید.

به این ترتیب فضای نمونه یا S برای این آزمایش را به شکل زیر می‌نویسیم:

S={HHH,HTT,THH,HHT,TTH,HTH,THT,TTT}S=\left\{HHH, HTT, THH, HHT, TTH, HTH, THT,TTT\right\}

تصویر کارتنی از چند دانش‌آمور در حال حل مسائل آمار

متغیر تصادفی X بر اساس سوال برابر است با تعداد دفعات رو آمدن سکه. با ۳ مرتبه پرتاب سکه، X ممکن است مقادیر ۰ یا ۱ یا ۲ یا ۳ را بپذیرد:

X(HHH)=3X(HHH)=3

X(HTT)=1X(HTT)=1

X(THH)=2X(THH)=2

X(HHT)=2X(HHT)=2

X(TTH)=1X(TTH)=1

X(HTH)=2X(HTH)=2

X(THT)=1X(THT)=1

X(TTT)=0X(TTT)=0

حالا از فرمول احتمال استفاده می‌کنیم که در آن برای مثال، P(X=1)P(X=1) احتمال این است که در این آزمایش فقط یک بار روی سکه دیده شود و n(X=1)n(X=1) برابر است با تعداد مقادیر X=1X=1. مثلا با توجه به روابط بالا می‌توانیم بنویسیم، n(X=1)=3n(X=1)=3. همچنین n(S)n(S) تعداد اجزای فضای نمونه یا S است که می‌شود ۸. پس تابع توزیع احتمال یا PMF برای این مثال به شکل زیر است:

P(X=0)=n(X=0)n(S)=18P(X=0)=\frac{n(X=0)}{n(S)}=\frac{1}{8}

P(X=1)=n(X=1)n(S)=38P(X=1)=\frac{n(X=1)}{n(S)}=\frac{3}{8}

P(X=2)=n(X=2)n(S)=38P(X=2)=\frac{n(X=2)}{n(S)}=\frac{3}{8}

P(X=3)=n(X=3)n(S)=18P(X=3)=\frac{n(X=3)}{n(S)}=\frac{1}{8}

همان‌طور که انتظار داریم، اگر احتمالات بالا را با هم جمع کنیم، حاصل برابر با یک خواهد شد.

معرفی چند توزیع‌ احتمال گسسته

در بخش‌های قبل به توضیح ویژگی‌های توزیع احتمال گسسته پرداختیم و یاد گرفتیم راه‌های توصیف این نوع توزیع احتمال چیست. در این بخش می‌خواهیم چند مورد از مرسوم‌ترین توزیع‌های احتمال گسسته را برای شما معرفی کنیم که عبارت‌اند از:

  • توزیع احتمال گسسته دو جمله‌ای
  • توزیع احتمال گسسته یکنواخت
  • توزیع احتمال گسسته پواسون

اگر خاطرتان باشد، در ابتدای مطلب نیز به این سه نوع توزیع، به‌عنوان پرکاربردترین انواع توزیع‌های احتمال اشاره کردیم. حالا می‌دانیم که این سه توزیع در گروه توزیع‌های احتمال گسسته قرار می‌گیرند. جزئیات مربوط به هر کدام از این توزیع‌ها بسیار گسترده است و ما در این نوشته به‌صورت مختصر هر کدام را فقط معرفی می‌کنیم. همچنین معادله ریاضیاتی تابع جرم احتمال را برای هر توزیع بیان خواهیم کرد. چنانچه تمایل دارید برای مثال در مورد توزیع چندجمله‌ای اطلاعات بیشتری کسب کنید، پیشنهاد ما این است که مطلب «متغیر تصادفی و توزیع چند جمله ای (Multinomial Distribution) — به زبان ساده» از مجله فرادرس را مطالعه کنید.

توزیع احتمال دو جمله‌ای چیست؟

در این قسمت می‌خواهیم ببینیم توزیع احتمال دو جمله‌ای به‌عنوان یکی از پرکاربردترین انواع توزیع‌ احتمال چیست و با چه معادله‌ای نشان داده می‌شود. توزیع احتمال یک متغیر تصادفی دو جمله‌ای، توزیع احتمال دو جمله‌ای نامیده می‌شود. متغیر تصادفی دو جمله‌ای، نوعی متغیر تصادفی گسسته است که تعداد موفقیت‌ها را در یک تعداد ثابت آزمایش تصادفی به‌دست می‌دهد، با این شرایط که هر آزمایش فقط دو نتیجه ممکن دارد و احتمال موفقیت نیز ثابت است. متغیرهای تصادفی که در مثال پرتاب سکه انتخاب کردیم، نمونه‌ای از متغیرهای تصادفی دو‌جمله‌ای هستند.

یک نمودار میله‌ای
نمونه‌ای از یک توزیع دو جمله‌ای

پس در توزیع احتمال دو‌جمله‌ای، متغیرها دارای دو نتیجه ممکن هستند. این توزیع توصیف کننده تعداد دفعات موفقیت در n تلاش است و احتمال موفقیت در آن با p نمایش داده می‌شود. برای مثال، فرض کنید یک سکه را ۵ بار پرتاب می‌کنید. اگر بخواهید تعداد دفعاتی که سکه رو می‌آید را نمایش دهید، بهترین انتخاب توزیع احتمال دو‌جمله‌ای است، چون هم دو مقدار نتیجه ممکن دارید (زیر یا رو) و هم بهترین توصیف برای این موقعیت این است که نشان دهید در n=5n=5 بار تلاش، احتمال موفقیت یا p چقدر بوده است. تابع جرم احتمال برای توزیع احتمال دو‌جمله‌ای دارای فرمول زیر است:

P(X=k)=n!k!(nk)!pk(1p)nkP(X=k)=\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}

توزیع احتمال یکنواخت گسسته چیست؟

در ادامه یادگیری خود می‌خواهیم ببینیم نوع یکنواخت توزیع نرمال چیست و چه ویژگی‌هایی دارد. توزیع احتمال گسسته یکنواخت برای توصیف رویدادهایی با احتمالات برابر بکار می‌رود. برای مثال تقاضای کشیدن کارت به‌صورت تصادفی. تابع جرم احتمال برای این نوع توزیع احتمال یکنواخت دارای فرمول زیر است:

P(X=x)=1ba+1P(X=x)=\frac{1}{b-a+1}

توزیع احتمال پواسون چیست؟

اگر بخواهیم بدانیم یکی دیگر از مرسوم‌ترین انواع توزیع احتمال چیست، بهتر است با فرمول توزیع پواسون آشنا شویم. توزیع احتمال پواسون داده‌های قابل شمارش را توصیف می‌کند. این نوع توزیع، احتمال وقوع یک رویداد با تعداد k بار در یک فاصله زمانی یا مکانی داده شده را می‌دهد. برای مثال تعداد پیام‌های دریافت شده هر روز. همچنین فرمول تابع جرم احتمال برای این توزیع به شکل زیر است:

P(X=k)=eλλkk!P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

یک نمودار میله‌ای
نمونه‌ای از یک توزیع پواسون

توزیع احتمال پیوسته چیست؟

پس از اینکه با انواع توزیع‌های احتمال گسسته آشنا شدیم، در این بخش می‌خواهیم ببینیم نوع پیوسته یک توزیع احتمال چیست. توزیع احتمال پیوسته توزیعی است که برای نمایش احتمالات وقوع یک متغیر پیوسته بکار می‌رود. متغیر پیوسته می‌تواند هر مقداری بین کمترین مقادیر ممکن و بیشترین مقدار ممکن خود داشته باشد. بنابراین توزیع احتمال پیوسته شامل هر نوع عددی خواهد بود.

منحنی اندازه‌گیری قد شخص
نمودار توزیع احتمال پیوسته برای اندازه‌گیری قد

در بخش‌های قبل دیدیم که برای نمایش یک توزیع احتمال گسسته می‌توانیم از جدول احتمال استفاده کنیم. همچنین یاد گرفتیم اگر بخواهیم توزیع احتمال گسسته را توسط یک معادله ریاضی توصیف کنیم، تابع جرم احتمال یا PMF را می‌نویسیم. در ادامه این بخش توضیح می‌دهیم که توصیف ریاضیاتی یک توزیع احتمال پیوسته با نوشتن «تابع چگالی احتمال» (Probability Density Function) یا PDF امکان‌پذیر است.

تابع چگالی احتمال (PDF)‌ چیست؟

در بخش‌های گذشته آموختیم که برای متغیرهای گسسته تابع توزیع احتمال چیست و چه نام دارد. در این بخش یاد می‌گیریم که برای توصیف یک توزیع احتمال پیوسته نیز می‌توان از یک معادله ریاضی به نام تابع چگالی احتمال یا PDF استفاده کرد. این معادله، چگالی احتمال هر مقدار ممکن برای یک متغیر را می‌دهد که می‌تواند از یک بزرگتر باشد. تابع چگالی احتمال را مانند تابع جرم احتمال می‌توان به شکل نمودار یا یک معادله ریاضی نمایش داد.

در فرم نموداری، تابع چگالی احتمال به شکل یک منحنی است و شما می‌توانید احتمال اینکه یک مقدار موردنظر در یک فاصله مشخص قرار بگیرد را تعیین کنید. روش کار به این صورت است که کافی است مساحت زیر منحنی را در آن بازه محاسبه کنید. همچنین می‌توانید از نرم‌افزار یا جداول مرجع برای انجام محاسبات کمک بگیرید. دقت کنید مساحت زیر منحنی کامل همیشه دقیقا برابر با یک است، چون کاملا مشخص است که هر مشاهده حتما در یک نقطه از بازه متغیر قرار خواهد گرفت.

نکته: یکی دیگر از توابعی که از نظر ریاضیاتی می‌تواند یک توزیع احتمال پیوسته را به‌خوبی توصیف کند، «تابع توزیع تجمعی» (Cumulative Distribution Function) یا CDF است.

در مثال بخش بعد، با تابع چگالی احتمال یا PDF یک نوع توزیع پیوسته و نمودار مربوط به آن آشنا خواهیم شد.

مثال نمایش توزیع احتمال پیوسته با تابع چگالی احتمال

فرض کنید متغیر پیوسته‌ای که قرار است بررسی کنیم، وزن آناناسی است که از توزیع احتمال پیوسته‌ای به نام توزیع نرمال پیروی می‌کند. می‌خواهیم ببینیم فرمول تابع چگالی احتمال یا PDF و نمودار مرتبط با این توزیع احتمال چیست. فرمول توزیع احتمال نرمال به‌صورت زیر است:

f(x)=1σ2πe12(xμσ)2f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{\frac{-1}{2}(\frac{x-\mu}{\sigma})^2}

که در آن f(x) چگالی احتمال وزن آناناس است. μ میانگین وزن آناناس نسبت به جامعه آماری است. اگر خاطرتان باشد در PMF مثال قبل میانگین با λ نشان داده می‌شد، اما برای PDF در این مثال، میانگین با μ نمایش داده می‌شود. پارامتر دیگری که در PDF داریم اما در PMF نداشتیم، σ یا انحراف معیار متغیر پیوسته یا وزن آناناس در جامعه است که در این مثال ۰٫۱۳ کیلوگرم خواهد شد. نحوه محاسبه مقادیر میانگین و انحراف معیار را در بخش‌های بعد حتما توضیح می‌دهیم. اگر تابع چگالی احتمال بالا را برای این توزیع نرمال به‌ شکل یک نمودار نشان دهیم، به‌صورت زیر خواهد شد:

تصویری از یک نمودار ساده و یک ستون داخل نمودار
نمودار تابع چگالی احتمال (PDF) برای توزیع احتمال نرمال وزن ‌آناناس‌ها

طبق شکل، احتمال اینکه یک آناناس وزنی کاملا برابر با ۲ کیلوگرم داشته باشد، صفر است. یعنی ممکن است وزن آناناسی خیلی خیلی نزدیک به ۲ کیلوگرم اندازه‌گیری شود، اما احتمالی برای اینکه وزن آن دقیقا ۲ کیلوگرم شود، وجود ندارد. علت این مسئله این است که گفتیم در مورد PDF باید سطح زیر منحنی را در نظر بگیریم. اگر یک نقطه مشخص مانند نقطه معادل با وزن ۲ کیلوگرم را روی محور افقی انتخاب کنیم، سطحی در زیر منحنی تشکیل نخواهد شد. اما با انتخاب یک بازه یا فاصله مشخص، می‌توانیم سطح زیر منحنی را تشکیل دهیم و با محاسبه مساحت آن احتمال را تعیین کنیم.

مثلا احتمال اینکه وزن یک آناناس در یک فاصله وزنی مشخصی قرار بگیرد، برای نمونه در بازه ۱٫۹۸ تا ۲٫۰۴ کیلوگرم، از صفر بیشتر است و این مسئله در نمودار نیز قابل نمایش است، به این صورت که در نمودار تابع چگالی احتمال این بخش را با سایه مشخص می‌کنیم (شکل بالا). در واقع اگر بازه وزنی ۱٫۹۸ تا ۲٫۰۴ کیلوگرم را روی محور افقی مشخص کنیم و آن را در راستای قائم امتداد دهیم تا به منحنی برسیم، سطح موردنظرمان ساخته شده است. این ناحیه سایه‌دار یا رنگ‌شده مساحتی به اندازه ۰٫۰۹ دارد، به این معنا که احتمالی برابر با عدد ۰٫۰۹ وجود دارد که یک آناناس، وزنی بین ۱٫۹۸ و ۲٫۰۴ کیلوگرم داشته باشد. محاسبه مساحت این ناحیه با نرم‌افزار‌های آماری انجام می‌شود.

معرفی چند توزیع‌ احتمال پیوسته

در مثال قبل دیدیم که متغیر پیوسته‌ای مانند وزن ‌آناناس از توزیع احتمالی به نام توزیع نرمال پیروی می‌کرد. در این بخش ابتدا چند توزیع احتمال پیوسته معروف را معرفی می‌کنیم و سپس هر کدام را به‌صورت مختصر همراه با مثال توضیح خواهیم داد:

  • توزیع‌ احتمال پیوسته نرمال
  • توزیع‌ احتمال پیوسته یکنواخت
  • توزیع‌ احتمال پیوسته «لاگ - نرمال» (Log-normal)
  • توزیع‌ احتمال پیوسته نمایی

همچنین خواهید دید که معادلات ریاضیاتی حاکم بر توابع چگالی احتمال این نوع توزیع احتمال چیست.

توزیع‌ احتمال نرمال چیست؟

احتمالا در مبحث توزیع احتمال با نمودار‌هایی شبیه یک زنگ برعکس شده زیاد مواجه شده‌اید. در این قسمت یاد می‌گیریم که معادله ریاضیاتی حاکم بر این نوع توزیع احتمال چیست. توزیع احتمال نرمال داده‌هایی را توصیف می‌کند که با دور شدن از مقدار میانگین، احتمال کمتری برای رخ دادن آ‌ن‌ها وجود دارد. تابع چگالی احتمال برای توزیع احتمال پیوسته نرمال شبیه یک زنگ (bell-shaped) است. فرمول تابع چگالی احتمال برای توزیع احتمال نرمال به‌صورت زیر است:

f(x)=1σ2πe12(xμσ)2f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{\frac{-1}{2}(\frac{x-\mu}{\sigma})^2}

منحنی با مساحت سطح آبی رنگ
نمونه‌ای از یک توزیع نرمال

توزیع احتمال یکنواخت پیوسته چیست؟

می‌خواهیم ببینیم تعریف نوع یکنواخت پیوسته برای یک توزیع احتمال چیست. توزیع یکنواخت هم برای متغیرهای پیوسته وجود دارد و هم برای متغیرهای گسسته. پس باید دقت کنید که با هم اشتباه نشوند. این نوع توزیع، داده‌هایی را که برای آن‌ها فواصل هم اندازه احتمال برابری دارند، نمایش می‌دهد. برای مثال مدت زمان انتظار ماشین‌ها برای چراغ قرمز. همچنین تابع PDF این نوع توزیع، فرمول ریاضی به شکل زیر خواهد داشت:

f(x)={1baaxb0x<a  or  x>bf(x)=\begin{cases}\frac{1}{b-a} & a\leq x \leq b\\0 & x < a \ \ or \ \ x > b\end{cases}

توزیع‌ احتمال لاگ - نرمال چیست؟

توزیع احتمال پیوسته لاگ - نرمال داده‌هایی با خمیدگی یا چولگی به سمت راست را توصیف می‌کند. به عبارت دیگر، متغیر تصادفی که لگاریتم آن‌ به‌صورت نرمال توزیع شده است، توسط این نوع توزیع نمایش داده می‌شود. برای نمونه، متوسط وزن بدن در گونه‌های مختلف پستانداران.

توزیع‌ احتمال نمایی چیست؟

در معرفی آخرین مورد از انواع توزیع‌های احتمال پیوسته، یاد می‌گیریم که نوع نمایی توزیع احتمال چیست. در توزیع احتمال نمایی، برای مقادیر کوچک نسبت به مقادیر بزرگ احتمال بالاتری در نظر گرفته می‌شود و معادل است با توزیع احتمال زمانی بین رویدادهای مستقل، برای مثال مدت زمان بین زمین‌لرزه‌ها. اگر بخواهیم برای تابع چگالی احتمال توزیع نمایی فرمولی بنویسیم، به‌صورت زیر خواهد بود:

f(x)={λeλxx00x<0f(x)=\begin{cases}\lambda e^{-\lambda x} & x\geq0\\0 & x < 0 \end{cases}

منحنی با سطح زیر به رنگ آبی
نمونه‌ای از یک توزیع نمایی

تابع توزیع احتمال چیست؟

با توجه به آنچه که در بخش‌های قبل گفته شد، احتمالا تا الان متوجه شده‌اید که تابع توزیع احتمال چیست و چه انواعی دارد. در توزیع احتمال، نتیجه یک متغیر تصادفی مشخص نیست. اگر مشاهده نتیجه را معادل محقق شدن در نظر بگیریم، می‌توانیم این مفهوم را تابعی تعریف کنیم که فضای نمونه را به فضای اعداد حقیقی نگاشت می‌کند.

توزیع احتمال پیوستهتوزیع احتمال گسسته
تابع چگالی احتمال یا PDFتابع جرم احتمال یا PMF
محاسبات: انتگرال‌گیریمحاسبات: شمارش، مجموع یا تناسب‌گیری

به خاطر داریم که فضای اعداد حقیقی را فضای حالت می‌نامند که می‌تواند گسسته یا پیوسته باشد. بنابراین با توجه به نوع توزیع احتمال (گسسته یا پیوسته)، دو نوع تابع توزیع احتمال داریم:

  • تابع توزیع احتمال گسسته، تابع جرم احتمال یا PMF نام دارد.
  • تابع توزیع احتمال پیوسته، تابع چگالی احتمال یا PDF نام دارد.

پارامترهای توزیع احتمال چیست؟

متغیرهای تصادفی دارای سه ویژگی مهم به نام «میانگین» (Mean) یا «امید ریاضی» (Expected Value)، «واریانس» (Variance) و «انحراف معیار» (Standard Deviation) هستند. با شناخت این سه پارامتر، تحلیل بهتری از توزیع احتمال خواهیم داشت. بنابراین پارامترهای توزیع احتمال عبارت‌اند از:

  • امید ریاضی (میانگین)
  • واریانس
  • انحراف معیار

در سه بخش بعد راجع‌به این کمیت‌های آماری توضیح خواهیم داد تا بهتر متوجه شوید ارتباط این مفاهیم با توزیع احتمال چیست.

امید ریاضی چیست؟

امید ریاضی نام دیگر میانگین یک متغیر تصادفی است و اغلب با (x)E یا μ برای متغیرهای پیوسته نمایش داده می‌شود. با انتخاب یک نمونه تصادفی از یک توزیع، انتظار این است که میانگین نمونه تقریبا برابر باشد با امید ریاضی. در مورد متغیرهای تصادفی گسسته، میانگین یا امید ریاضی برابر است با مجموع حاصل‌ضرب‌های هر مقدار ممکن X در احتمالش (X)P، که  توسط فرمول زیر نشان داده می‌شود:

μ=E(X)=XP(X)\mu =E(X)=\sum XP(X)

جدولی از اعداد با خانه‌های زرد

علامت ∑ به معنای مجموع است. اما در مورد متغیرهای تصادفی پیوسته، محاسبه امید ریاضی با انتگرال‌گیری روی XP(X)XP(X) امکان‌پذیر است:

μ=E(X)=XXf(X)\mu =E(X)=\int_{X} Xf(X)

اهمیت محاسبه میانگین در یک توزیع احتمال این است که متوجه شویم میزان تمایل مرکزی متغیرمان به چه صورت است.

واریانس چیست؟

واریانس یک متغیر تصادفی را با σ۲ نشان می‌دهیم که نشان‌دهنده میزان پخش‌شدگی آن متغیر حول میانگین است. بنابراین، واریانس پایین به معنای این است که متغیر ما تمایل دارد به مقدار مرکزی یا میانگین نزدیک باشد. در محاسبه واریانس نیز مانند محاسبه میانگین، در مورد متغیرهای پیوسته به جای محاسبه مجموع باید انتگرال‌گیری شود. برای محاسبه واریانس کافی است ابتدا اختلاف هر مقدار ممکن را از میانگین به‌دست آوریم. سپس عدد محاسبه شده را به توان دو برسانیم و در نهایت هر کدام از اعداد را در احتمال متناظر ضرب کنیم. مجموع مقادیر به‌دست آمده معادل واریانس است:

σ2=P(X)(XE(X))2\sigma^2=\sum P(X) (X-E(X))^2

انحراف معیار چیست؟

در انتها می‌خواهیم ببینیم آخرین پارامتر مهم برای یک توزیع احتمال چیست. انحراف معیار یک توزیع احتمال، نشان‌دهنده میزان تغییرپذیری آن است و اغلب توسط σ نشان داده می‌شود. برای محاسبه انحراف معیار کافی است ریشه دوم یا جذر واریانس را به‌دست آوریم.

روش محاسبه امید ریاضی (میانگین)

در بررسی نمودارهای PMF یا PDF، گفتیم که امکان محاسبه مقادیر میانگین داده‌ها وجود دارد. در این بخش می‌خواهیم ببینیم روش محاسبه امید ریاضی یا میانگین با داشتن توزیع احتمال چیست. برای این منظور کافی است فرمول، نمونه یا جدول احتمال آن توزیع را داشته باشیم. اولین نکته مهم برای یافتن امید ریاضی این است که بدانیم متغیرهای دو جمله‌ای، امید ریاضی و در نتیجه انحراف معیار ندارند. در مرحله بعد، با توجه به اطلاعاتی که در اختیار دارید، به سه روش ممکن است بتوانید امید ریاضی را محاسبه کنید:

  1. اگر فرمول توزیع را دارید، برای مثال تابع چگالی احتمال یا PDF، در این صورت امید ریاضی با پارامتر μ نمایش داده می‌شود. اگر پارامتر μ وجود نداشته باشد، امید ریاضی با استفاده از پارامترهای دیگر و با بکار بردن معادلاتی که برای هر توزیع مشخص هستند، قابل محاسبه است.
  2. اگر نمونه‌ دارید، در این صورت میانگین نمونه برآوردی است از امید ریاضی توزیع احتمال جامعه آماری. بنابراین هر چه اندازه نمونه بزرگتر باشد، این تخمین بهتر خواهد بود.
  3. اگر جدول احتمال را دارید، می‌توانید امید ریاضی را با ضرب کردن هر نتیجه ممکن در احتمال‌ آن و سپس جمع کردن این مقادیر با هم محاسبه کنید.

در مثال بخش بعد، با نحوه محاسبه امید ریاضی بیشتر آشنا خواهید شد.

مثال محاسبه امید ریاضی

به‌عنوان مثالی برای محاسبه امید ریاضی، فرض کنید نوعی پرنده آمریکایی پس از هر بار تخم‌گذاری بین ۲ تا ۴ تخم‌مرغ در لانه خود دارد. اگر جدول احتمال زیر، توزیع احتمال تعداد ‌تخم‌مرغ‌ها را به ازای هر لانه نشان دهد، امید ریاضی تخم‌مرغ‌‌ها به ازای هر لانه چقدر است؟

تخم‌مرغاحتمال
220.20.2
330.50.5
440.30.3

پاسخ

در این سوال، جدول احتمال داده شده است. پس از روش سوم استفاده می‌کنیم، به این صورت که ابتدا باید هر نتیجه ممکن یا XX را در احتمالش یا P(X)P(X) ضرب کنیم:

تخم‌مرغ یا XXاحتمال یا P(X)P(X)XP(X)XP(X)
220.20.22×0.2=0.42\times0.2=0.4
330.50.53×0.5=1.53\times0.5=1.5
440.30.34×0.3=1.24\times0.3=1.2

پس از اینکه مقادیر XP(X)XP(X) را حساب کردیم، باید آن‌ها را با هم جمع کنیم:

E(X)=0.4+1.5+1.2=3.1E(X)=0.4+1.5+1.2=3.1

به‌ این ترتیب امید ریاضی ‌تخم‌مرغ‌ها به ازای هر لانه به‌دست آمد.

روش محاسبه انحراف معیار

در ادامه یادگیری روش‌‌های محاسبه کمیت‌های مهم آماری، در این بخش قصد داریم توضیح دهیم روش محاسبه انحراف معیار در یک توزیع احتمال چیست. محاسبه انحراف معیار هم مانند امید ریاضی بسته به اینکه چه نوع اطلاعاتی در اختیار دارید، به سه روش امکان‌پذیر است:

  1. اگر فرمول توزیع را دارید، برای مثال تابع چگالی احتمال یا PDF، در این صورت انحراف معیار با پارامتر σ نمایش داده می‌شود. اگر پارامتر σ وجود نداشته باشد، انحراف معیار با استفاده از پارامترهای دیگر و با بکار بردن معادلاتی که برای هر توزیع مشخص هستند، قابل محاسبه است.
  2. اگر نمونه‌ دارید، در این صورت انحراف معیار نمونه تخمینی است از انحراف معیار توزیع احتمال جامعه آماری آن. بنابراین هر چه اندازه نمونه بزرگتر باشد، تخمین بهتری خواهیم داشت.
  3. اگر جدول احتمال دارید، ابتدا لازم است انحراف هر مقدار از امید ریاضی را محاسبه کنید. سپس حاصل را به توان دو رسانده و در احتمالش ضرب کنید. در انتها جذر مجموع مقادیر به‌دست آمده را بگیرید.

در بخش بعد با حل یک مثال، نحوه محاسبه انحراف معیار را بهتر یاد می‌گیرید.

تصویر کارتنی از گفتگوی چند نفر دور یک میز

مثال محاسبه انحراف معیار

مجددا مثال بخش محاسبه امید ریاضی را در نظر بگیرید که در آن نوعی پرنده آمریکایی پس از هر بار تخم‌گذاری بین ۲ الی ۴ تخم‌مرغ در لانه خود داشت. اگر جدول احتمال زیر، توزیع احتمال تعداد ‌تخم‌مرغ‌ها را به ازای هر لانه نشان دهد، انحراف معیار تخم‌مرغ‌ها به ازای هر لانه چقدر است؟

تخم‌مرغ
220.20.2
330.50.5
440.30.3

پاسخ

طبق آنچه که توضیح دادیم، در این مثال هم جدول احتمال داده شده است. پس از روش سوم برای محاسبه انحراف معیار استفاده می‌کنیم که در آن قدم اول محاسبه انحراف میان هر مقدار و امید ریاضی است:

تخم‌مرغ‌ یا XXاحتمال یا P(X)P(X)XE(X)X-E(X)
220.20.223.1=1.12-3.1=-1.1
330.50.533.1=0.13-3.1=-0.1
440.30.343.1=0.94-3.1=0.9

مرحله بعدی حساب کردن مربع مقادیر به‌دست آمده در ستون سوم جدول بالا است. همچنین لازم است حاصل هر خانه در احتمالش ضرب شود:

تخم‌مرغ یا XXاحتمال یا P(X)P(X)XE(X)X-E(X)(XE(X))2(X-E(X))^2P(X)(XE(X))2P(X)(X-E(X))^2
220.20.21.1-1.1(1.1)2=1.21(-1.1)^2=1.210.2×1.21=0.2420.2\times1.21=0.242
330.50.50.1-0.1(0.1)2=0.01(-0.1)^2=0.010.5×0.01=0.0050.5\times0.01=0.005
440.30.30.90.9(0.9)2=0.81(0.9)^2=0.810.3×0.81=0.2430.3\times0.81=0.243

در آخرین مرحله کافی است تمام مقادیر ستون پنجم جدول بالا را با هم جمع کنیم و از حاصل جذر بگیریم که به شکل زیر خواهد شد:

σ=(0.242+0.005+0.243)\sigma=\sqrt{(0.242+0.005+0.243)}

σ=0.49=0.7\sigma=\sqrt{0.49}=0.7

پس انحراف معیار برای این سوال برابر با ۰٫۷ تخم‌مرغ‌ شد.

مثال محاسبه انحراف معیار و امید ریاضی

یک شرکت سود سالانه خود روی محصول جدیدش را به شرح زیر برآورد می‌کند:

  • اگر سود شرکت از این محصول در سال اول ۳ میلیون تومان شود، محصول موفق بوده است.
  • اگر سود شرکت از این محصول در سال اول ۱ میلیون تومان شود، محصول نسبتا موفق بوده است.
  • اگر شرکت از این محصول در سال اول ۱ میلیون تومان ضرر کند، محصول ناموفق بوده است.

در کنار برآورد بالا، شرکت به هر نتیجه ممکن احتمالی به‌صورت زیر را نسبت می‌دهد:

  • احتمال موفق شدن: ۰٫۲۵
  • احتمال نسبتا موفق شدن: ۰٫۴
  • احتمال موفق نشدن: ۰٫۳۵
  1. امید ریاضی و انحراف معیار سود خالص این محصول در سال اول چقدر است؟
  2. اگر یک هزینه ثابت ۰٫۲ میلیون تومانی را در نظر بگیریم، مستقل از اینکه وضعیت موفقیت محصول به چه صورت است، امید ریاضی سود خالص این محصول چقدر است؟

پاسخ

در اولین قدم، سود خالص این محصول برای سال اول را XX (بر حسب میلیون تومان) فرض می‌کنیم. بنابراین می‌توانیم با توجه به اطلاعات صورت سوال، جدول زیر را برای XX و احتمال رخ دادن آن یا P(X)P(X) رسم کنیم، به این صورت که برای مثال اگر سود شرکت یا XX برابر با ۳ شود، یعنی شرکت موفق بوده است که احتمال آن ۰٫۲۵ در نظر گرفته شده است. اما اگر شرکت ۱ میلیون تومان ضرر دهد، به این معنا است که سود آن یا XXX برابر می‌شود با ۱- که احتمال رخ دادن چنین اتفاقی ۰٫۳۵ است:

سود یا XX33111-1
P(X)P(X)0.250.250.40.40.350.35

در این مثال در واقع با توجه به اطلاعاتی که داشتیم، جدول احتمال را رسم کردیم. با داشتن جدول احتمال، در اولین قدم برای محاسبه امید ریاضی باید هر مقدار XX را در احتمالش ضرب کنیم:

سود یا XXP(X)P(X)XP(X)XP(X)
330.250.250.3×0.25=0.750.3\times0.25=0.75
110.40.41×0.4=0.41\times0.4=0.4
1-10.350.351×0.35=0.35-1\times0.35=-0.35

سپس مقادیر آخرین ستون جدول بالا را با هم جمع می‌کنیم تا E(X)E(X) محاسبه شود:

E(X)=0.75+0.40.35=0.8E(X)=0.75+0.4-0.35=0.8

حالا می‌رویم سراغ محاسبه انحراف معیار. اولین قدم این است که اختلاف هر مقدار را با امید ریاضی پیدا کنیم:

سود یا XXP(X)P(X)XE(X)X-E(X)
330.250.2530.8=2.23-0.8=2.2
110.40.410.8=0.21-0.8=0.2
1-10.350.3510.8=1.8-1-0.8=-1.8

حالا با مجذور کردن ستون سوم جدول بالا و سپس ضرب کردن هر مقدار در احتمال مربوطه خواهیم داشت:

سود یا XXP(X)P(X)XE(X)X-E(X)(XE(X))2(X-E(X))^2P(X)(XE(X))2P(X)(X-E(X))^2
330.250.252.22.2(2.2)2=4.84(2.2)^2=4.840.25×4.84=1.210.25\times4.84=1.21
110.40.40.20.2(0.2)2=0.04(0.2)^2=0.040.4×0.04=0.0160.4\times0.04=0.016
1-10.350.351.8-1.8(1.8)2=3.24(-1.8)^2=3.240.35×3.24=1.1340.35\times3.24=1.134

جذر مجموع تمام مقادیر آخرین ستون از جدول بالا برابر است با انحراف معیار:

σ=(1.21+0.016+1.134)\sigma=\sqrt{(1.21+0.016+1.134)}

σ=2.36=1.53\sigma=\sqrt{2.36}=1.53

بنابراین σ یا انحراف معیار ۱٫۵۳ میلیون تومان خواهد شد. در سوال بعدی یک هزینه ثابت دیگر هم در نظر گرفته شده است. برای محاسبه امید ریاضی در چنین شرایطی داریم:

E(X0.2)=E(X)0.2=0.80.2=0.6E(X-0.2)=E(X)-0.2=0.8-0.2=0.6

 پس با در نظر گرفتن این هزینه ثابت، امید ریاضی کاهش می‌یابد و برابر است با ۰٫۶ میلیون تومان.

یادگیری پیشرفته کاربردهای آمار و احتمال با فرادرس

اهمیت یادگیری انواع توزیع‌‌ احتمال، کاربرد گسترده این توزیع‌ها در یادگیری ماشین (Machine Learning)، علم داده (Data Science) و تحلیل داده (Data analysis) است. بنابراین اگر قصد دارید در سطح پیشرفته‌تری به مباحث بیان شده در این نوشته مسلط شوید، پیشنهاد ما این است که ابتدا با کلیات مباحث آمار و احتمال در علوم مهندسی آشنا شوید. مشاهده این فیلم‌های آموزشی از فرادرس در مسیر یادگیری مقدمات موثر است:

تصویری از مجموعه فیلم های آموزش آمار و احتمالات در فرادرس
برای دسترسی به مجموعه فیلم آموزش آمار و احتمالات در فرادرس، روی تصویر کلیک کنید.
  1. فیلم آموزش تئوری احتمالات فرادرس
  2. فیلم آموزش مبانی احتمال حل تست کنکور ارشد فرادرس
  3. فیلم آموزش آمار و احتمال مهندسی با مثال های مختلف فرادرس
  4. فیلم آموزش آمار و احتمال مهندسی حل تمرین و تست کنکور ارشد فرادرس
  5. فیلم آموزش آمار و احتمالات مهندسی حل نمونه سوالات کنکور ارشد فرادرس
  6. فیلم آموزش رایگان مبانی احتمالات فرادرس
  7. فیلم آموزش رایگان متغیرهای تصادفی پیوسته فرادرس
  8. فیلم آموزش رایگان متغیرهای تصادفی (پ) در آمار و احتمال مهندسی (تست کنکور ارشد) فرادرس
  9. فیلم آموزش رایگان مسائل توزیع های گسسته و پیوسته در آمار و احتمال فرادرس

پس از اینکه کاملا به مباحث آمار و احتمال مسلط شدید، مشاهده فیلم‌های آموزشی زیر از مجموعه فرادرس در زمینه کاربردهای آمار و احتمال یا یادگیری نرم‌افزارهای آماری به شما کمک خواهد کرد:

  1. مجموعه آموزش اس پی اس اس SPSS – مقدماتی تا پیشرفته فرادرس
  2. فیلم آموزش محاسبات آماری در اکسل Excel فرادرس
  3. فیلم آموزش طراحی و آنالیز داده ها با نرم افزار اوریجین پرو OriginPro فرادرس
  4. فیلم آموزش برنامه نویسی R و نرم افزار RStudio مقدماتی فرادرس
  5. فیلم آموزش آمار و کاربرد آن در مدیریت فرادرس
  6. فیلم آموزش آمار و احتمال در پایتون Python فرادرس

جمع‌بندی

در این مطلب از مجله فرادرس، توضیح دادیم توزیع احتمال چیست، چه انواعی دارد و با چه توابعی نشان داده می‌شود. توزیع احتمال نوعی تابع آماری است که تمام مقادیر ممکن و احتمالات را برای یک متغیر تصادفی در یک بازه داده شده توصیف می‌کند. این بازه به بیشترین و کمترین مقادیر ممکن محدود می‌شود.

همچنین نقطه‌ای که یک مقدار ممکن در نمودار توزیع احتمال به خود اختصاص می‌دهد، توسط فاکتورهای دیگری مانند میانگین، واریانس و انحراف معیار آن توزیع احتمال قابل تشخیص است. تمام توزیع‌‌های احتمال با توجه به نوع متغیر تصادفی، در دو گروه قرار می‌گیرند. در جدول زیر خلاصه‌ای از تفاوت‌ها و ویژگی‌های دو نوع توزیع احتمال بیان شده است:

انواع توزیع احتمالتوزیع احتمال گسستهتوزیع احتمال پیوسته
بازه مقادیر ممکنفقط مجموعه خاصی از مقادیر را می‌پذیرد.هر مقدار از یک بازه داده شده را شامل می‌شود.
تابع توزیع احتمالتابع جرم احتمال یا PMFتابع چگالی احتمال یا PDF
 مجموع احتمالاتهمواره برابر با یک است. قابل محاسبه نیست.
بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
ScribbrGeeksforGeeksEwubdJavatpointMediumProbabilisticworldBBCBecominghumanStat20
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *