متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده

۱۴۸۹ بازدید

آخرین به‌روزرسانی: ۰۶ خرداد ۱۴۰۲

زمان مطالعه: ۵ دقیقه

متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده

براساس توزیع‌های آماری، می‌توان رفتار پدیده‌های تصادفی را شناخت. بسیاری از داده‌ها که مربوط به پدیده‌های تصادفی کسب و کار و داده‌های مالی و همینطور علوم آب (Hydrology) و فیزیک ذرات است، دارای توزیع کوشی (Cauchy Distribution) هستند. در نتیجه این توزیع از اهمیت خاصی برخوردار است. از طرف دیگر وجود خصوصیات جالب برای این توزیع، بسیاری از آماردانان را به سوی خود جلب کرده است.

فهرست مطالب این نوشته

متغیر تصادفی و توزیع کوشی

از آنجایی که در این نوشتار از متغیر تصادفی و تابع احتمال صحبت به میان خواهد آمد بهتر است ابتدا مطلب متغیر تصادفی، تابع احتمال و تابع توزیع احتمال را مطالعه کرده باشید. همچنین مطالعه مطلب مربوط به توزیع نرمال و قضیه حد مرکزی و توزیع t-student نیز خالی از لطف نیست.

متغیر تصادفی و توزیع کوشی

این توزیع به افتخار دانشمند و ریاضیدان بزرگ فرانسوی، اگوستین کوشی (Augustin Cauchy) نام‌گذاری شده است. او در قرن ۱۷، به بررسی توابع ریاضیاتی پرداخت که از لحاظ شکل تابعی شبیه تابع احتمال کوشی هستند. در سال ۱۸۲۴، ریاضیدان بزرگ فرانسوی «پواسن» (Poisson) این تابع را به عنوان یک توزیع آماری برشمرد. او در مقاله‌ای نشان داد که واریانس برای داده‌هایی که دارای توزیع کوشی باشند، وجود ندارد. البته در فیزیک به علت تحقیقاتی مجزایی که «هنریک لورنتز» (Hendrik Lorentz) روی داده‌ها با توزیع کوشی انجام داد به توزیع لورنتز نیز شهرت دارد. به همین علت گاهی آن را به توزیع کوشی-لورنتز می‌خوانند.

فیلم آموزش آمار و احتمال مهندسی – حل تمرین و تست کنکور ارشد در فرادرس

کلیک کنید

توزیع کوشی، یکی از انواع «توزیع‌های پایدار» (Stable Distribution) است که تابع چگالی احتمال آن فرم بسته دارد. قابل ذکر است که توزیع نرمال نیز از گروه توزیع‌های پایدار است، به این معنی که ترکیب خطی از دو متغیر تصادفی با توزیع نرمال با پارامترهای مختلف، باز هم دارای توزیع نرمال و برحسب ترکیبی از پارامترهای آن‌ها است.

در بین توزیع‌های پایدار، توزیع نرمال (Normal Distribution)، «توزیع کوشی» (Cauchy Distribution)، «توزیع هولتس‌مارک» (Holtsmark Distribution) و «توزیع لوی» (Levy Distribution) دارای فرم بسته برای تابع چگالی احتمال هستند.

تابع چگالی احتمال متغیر تصادفی کوشی

X متغیر تصادفی با توزیع کوشی است اگر تابع چگالی احتمال آن به صورت زیر باشد:

$$\large \displaystyle f(x;\theta,\gamma )=P(x)={\frac {1}{\pi \gamma \left[1+\left({\frac {x-\theta}{\gamma }}\right)^{2}\right]}}$$

در این رابطه، $$\theta$$ پارامتر مکان و $$\gamma$$ پارامتر مقیاس گفته می‌شود. در این حالت می‌نویسیم $$X\sim Cauchy(\theta,\gamma)$$ و می‌خوانیم، X دارای توزیع کوشی با پارامتر مکان $$\theta$$ و پارامتر مقیاس $$\gamma$$ است. تکیه‌گاه این متغیر تصادفی همه اعداد حقیقی است.

گاهی برای محاسبه جرم احتمال می‌توان از رابطه‌ای که در زیر نوشته شده، نیز استفاده کرد.

$$\large f(x;\theta,\gamma )={1 \over \pi \gamma }\left[{\gamma ^{2} \over (x-\theta)^{2}+\gamma ^{2}}\right]$$

شکل تابع چگالی احتمال (Probability Density Function -PDF) برای توزیع کوشی در تصویر زیر دیده می‌شود.

Cauchy_pdf

مشخص است که حداکثر این تابع در نقطه $$\theta$$ یعنی پارامتر مرکزی توزیع حاصل می‌شود. از طرفی در این توزیع با افزایش مقدار $$\gamma$$ گستردگی منحنی افزایش می‌یابد. به نوعی می‌توان پارامتر $$\gamma$$ را «نصف پهنا در نصف مقدار بیشینه» (Half Width at Half Maximum- HWHM) در نظر گرفت و دو برابر آن یعنی $$\gamma$$2 نیز نشان دهنده «پهنا در نصف مقدار بیشینه» (Full Width at Half Maximum- FWHM) است که در تصویر زیر دیده می‌شود.

FWHM

از طرفی پارامتر $$\gamma$$ را می‌توان نصف مقدار دامنه میان چارکی (Interquartile Range- IQR) نیز نامید. به این ترتیب فاصله بین چارک سوم و اول در این توزیع، دو برابر پارامتر مقیاس یعنی $$\gamma$$ در این توزیع است.

نکته: اگر مقدار پارامتر مرکزی برابر با صفر و پارامتر مقیاس نیز برابر با ۱ باشد، توزیع حاصل را کوشی استاندارد می‌نامند زیرا چنین توزیعی می‌تواند از تقسیم دو توزیع نرمال استاندارد مستقل ایجاد شود.در این حالت می‌نویسم $$X\sim Cauchy(0,1)$$ است.

در تصویر زیر مشخص است که توزیع کوشی استاندارد نسبت به توزیع نرمال استاندارد دارای دم‌های کلفت‌تری است. به این معنی که جرم احتمال در دم‌ها نسبت به توزیع نرمال استاندارد بیشتر است.

Cauchy-distribution

مقدار تابع توزیع احتمال تجمعی (Cumulative Distribution Function- CDF) برای این توزیع نیز براساس انتگرال روی تابع چگالی احتمال حاصل می‌شود. به این ترتیب داریم:

$$\large F_X(y)=P(X\leq y)=\int_{-\infty}^y f_x(x)dx=$$

$$\large {\frac {1}{\pi }}\arctan \left({\frac {x-\theta}{\gamma }}\right)+{\frac {1}{2}}$$

نمودار حاصل از تابع توزیع احتمال تجمعی برای این توزیع در تصویر زیر دیده می‌شود. مشخص است که با افزایش مقدار پارامتر $$\gamma$$ منحنی تابع توزیع تجمعی احتمال از حالت s بسته به s باز تبدیل می‌شود.

Cauchy_cdf

خصوصیات توزیع کوشی

با توجه به فرم تابع چگالی احتمال، امید ریاضی و واریانس برای متغیر تصادفی با توزیع کوشی وجود ندارد. بنابراین قضیه حد مرکزی را نمی‌توان برای این متغیر تصادفی به کار برد. به این معنی که مجموع n متغیر تصادفی مستقل و هم‌توزیع کوشی، نمی‌توانند برای مقدار‌های بزرگ n، دارای توزیع نرمال باشد.

فیلم آموزش متغیرهای تصادفی (الف) در آمار و احتمال مهندسی (مرور – تست کنکور ارشد) (رایگان) در فرادرس

کلیک کنید

ولی براساس نمودار و شکل تابع چگالی احتمال، مشخص است که «نما» (Mode) برای متغیر تصادفی با توزیع کوشی برابر با $$\theta$$ است. از طرفی با توجه به تقارن تابع چگالی احتمال، مشخص است که «میانه» (Median) نیز برای این متغیر تصادفی همان $$\theta$$ خواهد بود.

ارتباط با توزیع‌های دیگر

براساس تبدیلات و محاسباتی که بین متغیرهای تصادفی وجود دارد، می‌توان روابط زیر را بین توزیع کوشی و توزیع‌های دیگر مشخص کرد.

اگر U و V دو متغیر تصادفی با توزیع نرمال استاندارد باشند، آنگاه نسبت آن‌ها دارای توزیع کوشی استاندارد است.
اگر $$X_1,X_2,\cdots,X_n$$ متغیرهای تصادفی iid (مستقل و هم‌توزیع) با توزیع کوشی استاندارد باشند، آنگاه میانگین آن‌ها نیز دارای توزیع کوشی استاندارد است. یعنی داریم $$\bar{X}\sim Cauchy (0,1)$$.
توزیع t با یک درجه آزادی همان توزیع کوشی استاندارد است. یعنی اگر $$X\sim t(1)$$ آنگاه $$X\sim Cauchy (0,1)$$ خواهد بود.
اگر $$X\sim Cauchy (\theta , y)$$ آنگاه kX+l نیز دارای توزیع کوشی با پارامترهای $$\theta k +l$$ و $$\gamma|k|$$ است. یعنی داریم $$X\sim Cauchy(\theta k +l, \gamma|k|)$$ است.
اگر $$X\sim Cauchy (\theta_1,\gamma_1)$$ و $$Y\sim Cauchy(\theta_2,\gamma_2)$$ باشند، آنگاه به شرط مستقل بودن X و Y داریم:

$$\large X+Y\sim Cauchy(\theta_1+\theta_2,\gamma_1+\gamma_2)$$

و همچنین برای تفاضل دو متغیر تصادفی کوشی مستقل می‌توان نوشت:

$$\large X-Y\sim Cauchy(\theta_1-\theta_2,\gamma_1+\gamma_2)$$

برای متغیر تصادفی X با توزیع کوشی با پارامترهای مکان $$\theta=0$$ و $$\gamma$$ دلخواه داریم: $$\frac{1}{X}\sim Cauchy (0,\frac{1}{\gamma})$$
اگر X یک متغیر تصادفی با توزیع یکنواخت استاندارد باشد، آنگاه تانژانت $$\pi(X-\frac{1}{2})$$ دارای توزیع کوشی استاندارد است. یعنی می‌توان نوشت:

$$\large \displaystyle X\sim {\textrm {U}}(0,1) \rightarrow \tan \left(\pi \left(X-{\tfrac {1}{2}}\right)\right)\sim {\textrm {Cauchy}}(0,1)$$

کاربرد توزیع کوشی

یکی از کاربردهای جالب برای توزیع کوشی، مسئله فانوس دریایی است. این مسئله اولین بار توسط استفن گال (Stephen Gull) در سال 1988 مطرح شد. صورت مسئله در ادامه آمده است.

فرض کنید یک فانوس دریایی به فاصله $$\beta$$ از ساحل قرار دارد. طول جغرافیایی این فانوس برابر با $$\alpha$$ است. به این معنی که روی ساحل نیز نقطه‌ای با مختصات مثلا ($$\alpha,0$$) متناظر با فانوس‌دریایی وجود دارد. فانوس دریایی به طور تصادفی ولی با توزیع یکنواخت چشمک می‌زند. در نتیجه زاویه تابش آن نیز تصادفی است.

اشعه نورانی حاصل از این چشمک‌ها، به ساحل برخورد و بوسیله حسگرهای نور، شناسایی می‌شود. ولی متاسفانه این حسگرها، زاویه نور را شناسایی نمی‌کنند، بلکه فقط مشخص می‌کنند که آیا نور به آن‌ها تابیده شده یا خیر. با استفاده از حسگرهایی که در موقعیت‌ طول‌های جغرافیایی مختلف نصب شده، N بار برخورد نور ثبت شده است. فانوس دریایی کجاست؟

با توجه به اینکه زاویه تابش تصادفی است، مسئله باید برمبنای احتمال حل شود. فرض کنید تابع احتمال برای زاویه تابش یکنواخت باشد. یعنی اگر $$\theta$$ زاویه تابش باشد داریم:

$$\large \theta \sim U(-\frac{\pi}{2},\frac{\pi}{2})$$

پس تابع احتمال برای آن به صورت زیر نوشته می‌شود:

$$\large f(\theta,\alpha,\beta)=\frac{1}{\pi}$$

خواهیم دید که توزیع متغیر تصادفی X کوشی با پارامترهای $$\alpha$$ و $$\beta$$ است که براساس داده‌های مشاهده شده می‌توان آن‌ها را برآورد و موقعیت فانوس دریایی را بدست آورد.

lighthouse problem

با استفاده از رابطه زیر می‌توان موقعیت x را برحسب دو پارامتر $$\alpha$$ و $$\beta$$ نوشت.

$$\large X=\beta \tan \theta +a$$

با استفاده از تغییر متغیر برای محاسبه تابع چگالی احتمال، می‌توان تابع چگالی احتمال X را برحسب زاویه یعنی $$\theta$$ بدست آورد. پس داریم:

$$\large f_X(x|\alpha,\beta)=f_{\theta}(\theta| \alpha,\beta)\mid\frac{d\theta}{dx}\mid$$

در نتیجه با استفاده از مشتق‌گیری می‌توان نوشت:

$$\large \dfrac{d\theta}{dx}=\beta \sec^2(\theta)=\dfrac{\beta}{(x-\alpha)^2+\beta^2}$$

بر این اساس تابع چگالی احتمال برای متغیر تصادفی X به صورت زیر حاصل می‌شود.

$$\large f_X(x|\alpha,\beta)=\frac{1}{\pi}\dfrac{\beta}{(x-\alpha)^2+\beta^2}$$

که همان توزیع کوشی با پارامترهای $$\alpha$$ و $$\beta$$ است. بنابراین براساس تابع درستنمایی و بیشینه‌سازی آن می‌توان پارامترهای این توزیع را به کمک داده‌های جمع‌آوری شده از همه حسگرها برآورد کرد و مختصات فانوس دریایی را بدست آورد.

اگر به فراگیری مباحث مشابه مطلب بالا علاقه‌مند هستید، آموزش‌هایی که در ادامه آمده‌اند نیز به شما پیشنهاد می‌شوند:

بر اساس رای ۱۱ نفر

آیا این مطلب برای شما مفید بود؟

اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

ثبت نظر

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

۴ دیدگاه برای «متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده»

فرشته

۰۸ بهمن، در ۱۳۹۹ ۷:۰۶ ب.ظ

واقعن جامع و عالی است و برای منک اماری نیستم ولی اینها را نیاز دارم خیلی کمک کننده. همیشه دعا گوتون هستم.

پاسخ

آرش

۱۹ شهریور، در ۱۳۹۸ ۳:۰۷ ب.ظ

با درود فراوان،اینکه میفرمایین در توزیع کوشی میانگین و واریانس وجود نداره به این معناست که ما نمیتونیم حسابش کنیم یا اینکه غیر قابله تعریفه؟

پاسخ

آرمان ری بد

۰۲ مهر، در ۱۳۹۸ ۱۱:۲۱ ق.ظ

سلام و تشکر از توجه شما به مطالب فرادرس
متاسفانه برای محاسبه امید ریاضی و واریانس توزیع کوشی، انتگرال مربوطه همگرا نبوده و نامعین خواهد بود. به همین دلیل امید ریاضی و واریانس برای این توزیع قابل محاسبه نبوده و معرفی نمی‌شود. معمولا برای نشان دادن نقطه تمرکز در این توزیع از میانه استفاده می‌شود.
باز هم از اینکه همراه وبلاگ فرادرس هستید سپاسگزاریم.

آرمان ری بد

۰۲ مهر، در ۱۳۹۸ ۱۱:۱۲ ق.ظ

در پاسخ به آرش.
با سلام و تشکر از توجه شما به مطالب فرادرس
برای محاسبه امید ریاضی و واریانس یک توزیع آماری، باید انتگرال مربوط به امید ریاضی و واریانس همگرا باشد. متاسفانه در توزیع کوشی این انتگرال‌ها قابل محاسبه یا متناهی نیستند. در نتیجه امید ریاضی و واریانس برای توزیع‌هایی مانند کوشی وجود ندارند. معمولا در این حالت به جای امید ریاضی از میانه توزیع به عنوان پارامتر مرکزی توزیع استفاده می‌شود.
باز هم از اینکه همراه فرادرس هستید متشکریم.

نظر شما چیست؟

برچسب‌ها

متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده

متغیر تصادفی و توزیع کوشی

تابع چگالی احتمال متغیر تصادفی کوشی

خصوصیات توزیع کوشی

ارتباط با توزیع‌های دیگر

کاربرد توزیع کوشی

داده پرت چیست و چطور آن را تشخیص دهیم؟ – توضیح به زبان ساده

روش های مدیریت داده های گمشده در یادگیری ماشین – به زبان ساده

پاکسازی داده چیست؟ – Data Cleaning از صفر تا صد

تکنیک های جایگذاری داده های گمشده – معرفی به زبان ساده

انواع داده ها در یادگیری ماشین چیست؟ – به زبان ساده

دیتاست چیست؟ – آنچه باید درباره مجموعه داده ها بدانید

پردازش داده چیست؟ – Data Processing به زبان ساده

پیش پردازش داده ها چیست و چگونه در پایتون انجام می شود؟

علم داده چیست و چه کاربردی دارد؟ – به زبان ساده

تفاوت طبقه بندی و خوشه بندی در یادگیری ماشین چیست؟ – ۳ فرق کلیدی