توزیع تجمعی — به زبان ساده

۵۵۴۰ بازدید
آخرین به‌روزرسانی: ۱۸ اردیبهشت ۱۴۰۲
زمان مطالعه: ۸ دقیقه
توزیع تجمعی — به زبان ساده

در مطالب گذشته وبلاگ فرادرس توزیع‌های آماری مختلفی را توضیح دادیم. مهم‌ترین آن‌ها، توزیع‌های نرمال، پواسون، برنولی و هندسی بودند. در این مطلب نیز قصد داریم تا یکی از توزیع‌های پرکاربرد تحت عنوان تابع توزیع تجمعی را معرفی کرده و مثال‌هایی نیز از آن ارائه دهیم.

فهرست مطالب این نوشته

توزیع تجمعی

یکی از راه‌های توصیف توزیع متغیر‌های گسسته، استفاده از تابع جرم احتمال (PMF) است. به‌طور دقیق‌تر می‌توان گفت که تابع جرم احتمال را نمی‌توان برای متغیر‌های تصادفی پیوسته تعریف کرد. تابع توزیع تجمعی (CDF) مربوط به یک متغیر تصادفی، راه جایگزینی به‌منظور توصیف متغیر‌های تصادفی است.

مزیت تابع توزیع تجمعی این است که می‌توان آن را برای هر نوع از متغیر تصادفی تعریف کرد. تابع توزیع تجمعی برای متغیر تصادفی $$ X $$، مطابق با گزاره زیر تعریف می‌شود.

$$ F _ X ( x ) = P ( X \leq x ) , \textrm { for all } x \in \mathbb { R } $$

اجازه دهید به‌منظور درک بهتر مثالی کمی را مطرح کنیم که در ادامه نحوه حل آن نیز ارائه شده است.

مثال ۱

سکه‌ای را در نظر بگیرید که دوبار آن را پرتاب می‌کنیم. فرض کنید $$ X $$ تعداد دفعاتی است که شیر می‌آید. در این صورت تابع توزیع تجمعی $$ X $$ را بیابید. در اولین گام باید بگوییم که آزمایش برای دوبار انجام می‌شود. در هریک از این آزمایش‌ها نیز احتمال شیر یا خط بودن برابر با ۵۰ درصد است. بنابراین می‌توان گفت:

$$ X \sim Bi n om ial ( 2 , \frac { 1 } { 2 } ) $$

در حقیقت متغیر $$ X $$ می‌تواند هریک از حالات زیر را داشته باشد ($$ R _ X $$ نشان‌دهنده تعداد دفعاتی است که شیر یا خط ظاهر می‌شود).

$$ R _ X = \{ 0 , 1 , 2 \} $$

احتمال هریک از حالات فوق نیز برابر است با:

$$ P _ X ( 0 ) = P ( X = 0 ) = \frac { 1 } { 4 } $$

$$ P _ X ( 1 ) = P ( X = 1 ) = \frac { 1 } { 2 } $$

$$ P _ X ( 2 ) = P ( X = 2 ) = \frac { 1 } { 4 } $$

به‌منظور یافتن تابع توزیع تجمعی به صورت زیر عمل می‌کنیم. بدیهی است که مقدار $$ X $$ نمی‌تواند منفی باشد. از این رو این حالت را می‌توان مطابق با گزاره زیر بیان کرد:

$$ F_ X ( x ) = P ( X \leq x ) = 0 , \textrm { for } x < 0 $$

در حالتی که $$ 0 \leq x < 1 $$ باشد نیز احتمال رخ‌داد برابر با $$ 0.25 $$ است. در نتیجه این حالت را می‌توان به‌صورت زیر بیان کرد:

$$ F _ X ( x ) = P ( X \leq x ) = P ( X = 0 ) = \frac { 1 } { 4 } , \textrm { for } 0 \leq x < 1 $$

حالت نهایی نیز زمانی است که $$ x $$ در بازه $$ 1 \leq x < 2 $$ قرار داشته باشد. در این حالت احتمال رخ‌داد برابر است با:

$$ F _ X ( x ) = P ( X \leq x ) = P ( X = 0 ) + P ( X = 1 ) = \frac { 1 } { 4 } + \frac { 1} { 2 } = \frac { 3 } { 4 } , \textrm{ for } 1 \leq x < 2 $$

در نتیجه نهایتا می‌توان تابع توزیع احتمال مربوط به این دو پرتاب را در قالب تابع چند‌ضابطه‌ای زیر بیان کرد:

$$ \begin{equation} \nonumber F_X(x) = \left\{
\begin{array} { l l } 0 & \quad \text {for } x < 0\\
\frac { 1 } { 4 } & \quad \text {for } 0 \leq x < 1\\
\frac { 3 } { 4 } & \quad \text {for } 1 \leq x < 2 \\
1 & \quad \text {for } x \geq 2\\
\end {array} \right. \end {equation} $$

توجه داشته باشید هنگامی که از شما خواسته می‌شود که تابع توزیع تجمعی یک متغیر تصادفی را بیابید، شما باید تابع را به ازای تمامی خط حقیقی بیابید. همچنین در مورد متغیر‌های تصادفی گسسته در هنگام استفاده از ">" و "<" باید دقت داشته باشید. شکل ارائه شده در زیر نشان‌دهنده تابع $$ F _ X ( x ) $$ است.

CDF

همان‌طور که در نمودار فوق نیز نشان داده شده مقدار تابع توزیع به ازای مقادیر صحیح به‌صورت خط صاف بوده و تنها در مقادیر صحیح دارای ناپیوستگی است. نکته دیگر آن است که اندازه پرش در هر نقطه برابر با میزان احتمال در آن نقطه است. برای نمونه احتمال به ازای $$ x = 1 $$ برابر با $$ \frac { 1 } { 2 } $$ است ($$ P _ X ( 1 ) = \frac { 1 } { 2 } $$). از این رو در این نقطه اندازه پرش نیز به همین میزان است.

حال حالتی کلی‌تر را بررسی می‌کنیم. در این حالت فرض کنید $$ X $$ متغیری تصادفی و گسسته باشد که بتواند هریک از مقادیر $$ R _ X = \{ x _1 , x _ 2 , x _ 3 , . ..\} $$ را اختیار کند. توجه داشته باشید که متغیر‌ها به‌ترتیب از کوچک به بزرگ نوشته شده‌اند.

$$ x _ 1 < x _ 2 < x _ 3 < . . . $$

هم‌چنین به‌منظور سادگی بیشتر فرض بر این است که $$ R _ X $$ از پایین به مقدار $$ x _ 1 $$ محدود شده و این عدد کوچک‌ترین مقدار در $$ R _ X $$ باشد. در شکل زیر تابع توزیع احتمال یا $$ F _ X ( x ) $$ برای چنین توزیعی نشان داده شده است.

 

توزیع تجمعی

همان‌طور که مشاهده می‌کنید تابع توزیع در چنین حالتی به‌صورت پله‌ای است. تابع پله‌ای در این حالت از صفر شروع شده و همانند مثال بین مقادیر صحیح به‌صورت صاف است. از این رو می‌توان تابع را بین دو مقدار $$ k $$ و $$ k + 1 $$ مطابق با رابطه زیر بیان کرد:

$$ F _ X ( x ) = F _ X ( x _ k ) , \textrm { for } x _ k \leq x < x _ { k + 1 } $$

همان‌طور که در بالا نیز بیان شده اندازه پرش در $$ x _ k $$ برابر با احتمال رخ‌داد در $$ x _ k $$ است. در نتیجه می‌توان رابطه زیر را بیان کرد:

به اندازه کافی کوچک $$ F _ X ( x _ k ) - F _ X ( x _ k - \epsilon ) = P _ X ( x _ k ) , \textrm { For $\epsilon>0$ } $$

بنابراین تابع توزیع احتمال همواره تابعی غیرکاهشی محسوب می‌شود. این جمله به معنای آن است که اگر $$ y $$ بیشتر از $$ x $$ باشد ($$ y \geq x $$)، در این صورت $$ F _ X ( y ) $$ نیز بیشتر از $$ F _ X ( x ) $$ است ($$ F _ X ( y ) \geq F _ X ( x ) $$). نهایتا و در حالتی حدی نیز می‌توان گفت:

$$ \lim _ { x \rightarrow \infty } F _ X ( x ) = 1 $$

توجه داشته باشید که تابع توزیع تجمعی به‌طور کامل نحوه توزیع متغیر تصادفی و گسسته را توصیف می‌کند. با استفاده از این نمودار، تابع جرم احتمال یا همان $$ P M F $$ را نیز به‌راحتی می‌توان بدست آورد. همانند بالا اگر فضای $$ R _ X $$ را به‌صورت $$ R _ X = \{ x _ 1 , x _ 2 , x _ 3 , . . .\} $$ در نظر بگیریم، می‌توان رابطه بین دو توزیع را به شکل زیر بیان کرد:

$$ F _ X ( x ) = \sum _ { x _ k \leq x } P _ X ( x _ k ) $$

حال می‌خواهیم رابطه‌ای را اثبات کنیم که از آن در محاسبه توزیع تجمعی بسیار استفاده می‌شود. این رابطه با فرض $$ a \leq b $$، به‌صورت زیر است.

$$ \hspace {0pt} P ( a < X \leq b ) = F _ X ( b ) - F _ X ( a ) \hspace {00pt} $$

به‌منظور اثبات رابطه فوق در ابتدا باید بدانید که در حالت $$ a \leq b $$ می‌توان رابطه زیر را برای احتمال نوشت:

$$ P ( X \leq b ) = P ( x \leq a ) + P ( a < X \leq b ) $$

در نتیجه رابطه فوق را می‌توان بر حسب تابع توزیع تجمعی، به‌صورت زیر بازنویسی کرد:

$$ F _ X ( b ) = F  _ X ( a ) + P ( a < X \leq b ) $$

در این حالت نیز باید به تفاوت دو علامت "$$ < $$" و " $$ \leq $$ " توجه داشته باشید چراکه مفهوم آن‌ها در موارد استفاده از متغیر‌های تصادفی گسسته متفاوت است. در آینده نشان خواهیم داد که معادله ارائه شده در بالا برای انواع مختلف متغیر‌های تصادفی درست خواهد بود. توجه داشته باشید که تابع توزیع تجمعی تنها به ما $$ P ( X \leq x ) $$ را می‌دهد. به‌منظور حذف کردن تساوی در نامساوی و یافتن $$ P ( X  < x ) $$، برای یک متغیر تصادفی گسسته، کافی است از رابطه زیر استفاده کنید.

$$ P( X < x ) = P( X \leq x ) -P ( X = x ) = F _X ( x ) - P _ X ( x ) $$

مثال ۲

فرض کنید $$ X $$ متغیری گسسته و تصادفی با برد $$ R _ X = \{ 1 , 2 , 3 , ...\} $$ باشد. هم‌چنین فرض کنید تابع جرم احتمالِ $$ X $$ نیز مطابق با رابطه زیر محاسبه شود.

$$ P _ X ( k ) = \frac { 1 } { 2 ^ k } \textrm { for } k = 1 , 2 , 3 , ...$$

در این صورت موارد زیر را بیابید.

  • تابع توزیع تجمعیِ $$ X $$ ($$ F _ X ( x ) $$)
  • تابع $$ P $$ در بازه $$ 2 < X \leq 5 $$
  • تابع $$ P $$ در بازه $$ X > 4 $$

در ابتدا خوب است بدانید که رابطه ارائه شده به‌راستی نشان‌دهنده تابع توزیع احتمال است. چراکه حاصل جمع مقادیر آن برابر است با:

جمع هندسی $$ \sum _ { k = 1 } ^ { \infty } P _ X ( k ) = \sum _ { k = 1 } ^ { \infty } \frac { 1 } { 2 ^‌ k } = 1‌\textrm { } $$

مقادیر تابع توزیع احتمال در هریک از بازه‌ها برابر است با:

$$ \begin {align*} & For \ \ \ x < 1 \ \ \ \ \ \ \ \ \ \ \ \ \ \ F _ X ( x ) = 0 \\ & For \ \ \ 1 ≤ x < 2 \ \ \ \ \ \ F _ X ( x ) = P_X ( 1 ) = \frac{1}{2} \\ & For \ \ \ 2 ≤ x < 3 \ \ \ \ \ \ F _ X ( x ) = P_X ( 1 ) + P_X ( 2 ) = \frac{1}{2} + \frac{1}{4} = \frac{3}{ 4} \end {align*} $$

در حالت کلی داریم:

$$ \textrm {For } 0 < k \leq x < k + 1 $$

$$ F _ X ( x ) = P _ X ( 1 ) + P_ X ( 2 ) +...+ P _ X ( k ) $$

$$ =\frac { 1 } { 2 } + \frac { 1 } { 4 } +...+ \frac { 1 } { 2 ^ k} = \frac { 2 ^ k - 1 } { 2 ^ k } $$

شکل زیر نشان‌دهنده تابع توزیع بدست آمده است.

CDF

$$ P ( 2 < X \leq 5 ) $$ را می‌توان به‌صورت زیر بدست آورد.

$$ P ( 2 < X \leq 5 ) = F _ X ( 5 ) - F _ X ( 2 ) = \frac {31} { 3 2 } -\frac { 3 } {4} = \frac {7} { 3 2 } $$

البته مقدار فوق را می‌توان با استفاده از مفهوم احتمال نیز به‌صورت زیر بدست آورد.

$$ P ( 2 < X \leq 5 ) = P _ X ( 3 ) + P _ X ( 4 )+ P _ X (5 ) = \frac { 1 } { 8} + \frac { 1} {1 6 } + \frac {1} { 3 2 } = \frac {7} {3 2 } $$

همان‌طور که مشاهده می‌کنید این روش نیز همان پاسخ را به ما می‌دهد. نهایتا برای بدست آوردن $$ P ( X > 4 ) $$ نیز می‌توان از مفهوم مجموع مقادیر احتمال بهره برد. با استفاده از این مفهوم داریم:

$$ P ( X > 4 ) = 1 - P ( X \leq 4 ) = 1 - F _ X ( 4 ) = 1 - \frac { 1 5 }{ 1 6 } = \frac { 1 } {1 6} $$

در مطالب آینده وبلاگ فرادرس در مورد دیگر توابع احتمال نیز بحث کرده و کابرد‌های تابع توزیع احتمال تجمعی را بیشتر معرفی خواهیم کرد.

در صورت علاقه‌مندی به مباحث مرتبط در زمینه ریاضی و آمار، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۳۲ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
probabilitycourse
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *