خانواده توزیع های پایدار — مفاهیم اولیه

۷۸۰ بازدید

آخرین به‌روزرسانی: ۰۹ خرداد ۱۴۰۲

زمان مطالعه: ۵ دقیقه

«خانواده توزیع‌ های پایدار» (Stable Distribution Family) به مانند «خانواده نمایی» (Exponential Family) دارای خصوصیات جالبی است که اعضای این خانواده از توزیع‌ها را نسبت به دیگر خانواده‌ها متمایز می‌کند. نظریه خانواده توزیع های پایدار ابتدا در سال ۱۹۲۴ توسط آمارشناس فرانسوی «پائول لوی» (Paul Levy) معرفی و مطرح شد. بعدها با توجه به اهمیت این توزیع‌ها در دنیای واقعی، توجه آمارشناسان به آن‌ها بیشتر شد بطوری که «قضیه حد مرکزی تعمیم یافته» (Generalized Central Limit Theorem) نقطه عطفی برای این خانواده از توزیع‌ها محسوب می‌شود.

فهرست مطالب این نوشته

خانواده توزیع های پایدار

در این نوشتار به معرفی و بررسی بعضی از خصوصیات خانواده توزیع های پایدار خواهیم پرداخت. به این منظور به عنوان مقدمه بهتر است نوشتارهای توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها و متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده را مطالعه کنید. البته خواندن مطلب توزیع های آماری F و T — مفاهیم و کاربردها و متغیر تصادفی و توزیع کای 2 (Chi Squared) — مفاهیم و کاربردها نیز خالی از لطف نیست.

خانواده توزیع های پایدار

در نظریه آمار، توزیع احتمال را پایدار گویند اگر ترکیبی خطی از دو متغیر تصادفی با توزیع مذکور دارای همان توزیع باشد. البته ممکن است در این بین پارامترهای مکان یا مقیاس تغییر کنند ولی توزیع ثابت باقی می‌ماند. به زبان ریاضی می‌توان این خصوصیت را به صورت زیر بیان کرد.

فیلم آموزش تئوری احتمالات – جامع و با مفاهیم کلیدی در فرادرس

کلیک کنید

توزیع های پایدار (Stable Distribution)

اگر $X_1$ و $X_2$ دو نسخه مستقل از متغیر تصادفی $X$ با توزیع $f$ باشند، چنانچه رابطه زیر برقرار باشد توزیع $f$ را پایدار ‌می‌گویند.

$\large aX_1+bX_2 \stackrel{D}{\sim}cX +d,\;\; a,b,c >0$

این امر نشان می‌دهد که توزیع متغیرهای تصادفی نسبت به ترکیب خطی در این خانواده بسته است.

نکته: اگر مقدار $d$ صفر باشد توزیع را «اکیدا پایدار» (Strictly Stable) می‌نامند.

توزیع‌هایی مانند توزیع نرمال (Normal Distribution)، کوشی (Cauchy Distribution) و «توزیع لوی» (Levy Distribution) از اعضای این خانواده از توزیع‌ها هستند.

برای نمایش این توزیع‌ها اغلب از «تابع مشخصه» (Characteristic Function) استفاده می‌شود. برای متغیر تصادفی $X$ تابع مشخصه به صورت زیر نوشته و محاسبه می‌شود.

$\large {\displaystyle {\begin{cases}\varphi _{X}\!:\mathbb {R} \to \mathbb {C} \\\varphi _{X}(t)=\operatorname {E} \left[e^{itX}\right]=\int _{\mathbb {R} }e^{itx}\,dF_{X}(x)\end{cases}}}$

در اینجا منظور از $F_X$ همان توزیع تجمعی متغیر تصادفی $X$ و انتگرال هم انتگرال ریمان-استیلت‌یس است.

جدول زیر به بعضی از توابع مشخصه توزیع‌های مهم پرداخته است.

توزیع	تابع مشخصه
توزیع برنولی	$\large {\displaystyle \!\,1-p+pe^{it}}$
توزیع دو جمله‌ای	$\large {\displaystyle \!\,(1-p+pe^{it})^{n}}$
توزیع دو جمله‌ای منفی	$\large{\displaystyle \,{\biggl (}{\frac {1-p}{1-pe^{i\,t}}}{\biggr )}^{\!r}}$
توزیع یکنواخت (گسسته)	$\large{\displaystyle {\frac {e^{ait}-e^{(b+1)it}}{(b-a+1)(1-e^{it})}}}$
توزیع یکنواخت (پیوسته)	$\large{\displaystyle \!\,{\frac {e^{itb}-e^{ita}}{it(b-a)}}}$
توزیع لاپلاس	$\large{\displaystyle \!\,{\frac {e^{it\mu }}{1+b^{2}t^{2}}}}$
توزیع نرمال	$\large {\displaystyle \!\,e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}} {\displaystyle \!\,e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}}$
توزیع کای ۲	$\large {\displaystyle \!\,(1-2it)^{-k/2}}$
توزیع کوشی	$\large {\displaystyle e^{it\mu -\theta \|t\|}}$
توزیع گاما	$\large {\displaystyle (1-it\theta )^{-k}}$
توزیع نمایی	$\large{\displaystyle \!\,(1-it\lambda ^{-1})^{-1}}$

براساس تابع مشخصه می‌توان تابع چگالی متغیر تصادفی $X$ را به کمک تبدیل فوریه (Fourier Transform) بدست آورد. به این ترتیب رابطه زیر بین تابع مشخصه و تابع چگالی برقرار است.

$\large f(x)=\frac{1}{2\pi}\int_{-\infty}^\infty \varphi(t)e^{-ixt}\,dt$

تابع مشخصه برای خانواده توزیع های پایدار

توزیع‌های پایدار با چهار پارامتر شناخته می‌شوند. پارامتر اول $\alpha$ یا پارامتر پایداری (Stable Parameter) نامیده می‌شود که مقداری در بازه $(0,2]$ است. هر چه مقدار $\alpha$ به صفر نزدیک شود توزیع دارای دم‌های کلفت‌تری خواهد بود بطوری که احتمال مشاهده مقدارهای بزرگ بیشتر خواهد شد.

پارامتر دوم $\beta$ است، که پارامتر «چولگی» (Skewness) نامیده شده و در بازه $[-1,1]$ قرار گرفته. این پارامتر میزان تقارن را برای توزیع مشخص می‌کند. اگر $\beta=0$ باشد، توزیع متقارن خواهد بود. از آنجایی که $\alpha$ و $\beta$ شکل توزیع را مشخص می‌کنند، به آن‌ها پارامترهای شکل (Shape Parameters) نیز می‌گویند.

در ادامه به ترتیب $\mu$ پارامتر مکان بوده و $c$ نیز پارامتر مقیاس و نامنفی است. به این ترتیب تابع مشخصه برای توزیع پایدار به صورت زیر نوشته خواهد شد.

$\large {\displaystyle \varphi (t;\alpha ,\beta ,c,\mu )=\exp \left(it\mu -|ct|^{\alpha }\left(1-i\beta \operatorname {sgn}(t)\Phi \right)\right)}$

که در آن $\Phi$ به صورت زیر حاصل می‌شود.

$\large {\displaystyle \Phi ={\begin{cases}\tan \left({\frac {\pi \alpha }{2}}\right)&\alpha \neq 1\\-{\frac {2}{\pi }}\log |t|&\alpha =1\end{cases}}}$

نکته: تابع sgn همان تابع علامت است که در صورت منفی بودن پارامتر آن مقدار $-1$ و در صورت مثبت بودن پارامتر آن مقدار $+1$ خواهد داشت. البته اگر $t=0$ باشد مقدار تابع علامت هم صفر در نظر گرفته می‌شود.

در این صورت متغیر تصادفی $X$ را دارای توزیع پایدار گویند و آن را به صورت زیر نمایش می‌دهند.

$\large X \sim S(x; \alpha, \beta ,c, \mu)$

از آنجایی که محاسبه انتگرال بالا برای پیدا کردن تابع چگالی، برای همه مقادیر پارامترها امکان‌پذیر نیست در بیشتر مواقع اعضای خانواده توزیع‌های پایدار را با تابع مشخصه براساس چهار پارامتر گفته شده، معرفی می‌کنند. در ادامه به معرفی چهار توزیع پایدار می‌پردازیم که تابع چگالی آن‌ها به کمک انتگرال‌گیری مشخص می‌شود.

توزیع نرمال (Normal Distribution)

اگر $X$ متغیر تصادفی با توزیع پایدار با پارامترهای $\alpha=2$ و $\sigma^2=2c^2$ به عنوان پارامتر واریانس یا مقیاس و $\mu$ به عنوان پارامتر مرکزی باشد، دارای توزیع نرمال با میانگین $\mu$ و واریانس $\sigma^2$ است. در نتیجه تابع چگالی آن به شکل زیر درخواهد آمد.

$\large {\displaystyle f(x\mid \mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}$

همانطور که مشخص است در اینجا پارامتر چولگی $\beta$ هیچ تاثیری در توزیع ندارد.

توزیع کوشی (Cauchy Distribution)

متغیر تصادفی $X$ با توزیع پایدار با پارامترهای $\alpha=1$ و $\beta=0$ دارای توزیع کوشی با پارامترهای مقیاس $c$ و مکان $\mu$ است.

فیلم آموزش متغیرهای تصادفی (پ) در آمار و احتمال مهندسی (مرور – تست کنکور ارشد) (رایگان) در فرادرس

کلیک کنید

به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.

$\large f(x;\mu,c)={\frac {1}{\pi c \left[1+\left({\frac {x-\mu}{c}}\right)^{2}\right]}}={1 \over \pi c}\left[{c^{2} \over (x-\mu)^{2}+c^{2}}\right]$

توزیع لوی (Levy Distribution)

متغیر تصادفی $X$ با توزیع پایدار با پارامترهای $\alpha=\frac{1}{2}$ و $\beta=1$ دارای توزیع لوی با پارامترهای مقیاس $c$ و مکان $\mu$ است. به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.

$\large f(x;\mu,c)=\sqrt{\frac{c}{2\pi}}~~\frac{e^{ -\frac{c}{2(x-\mu)}}} {(x-\mu)^{3/2}}, \;\; x\geq \mu$

توزیع هولتسمارک (Holtsmark Distribution)

متغیر تصادفی $X$ با توزیع پایدار با پارامترهای $\alpha=\frac{۳}{2}$ و $\beta=0$ دارای توزیع هولتسمارک با پارامترهای مقیاس $c$ و مکان $\mu$ است. به این ترتیب تابع چگالی آن به ازاء $mu=0$ و $\sigma=1$ به صورت زیر نوشته خواهد شد.

$\large {\displaystyle {\begin{aligned}f(x;0,1)&={1 \over \pi }\,\Gamma \left({5 \over 3}\right){_{2}F_{3}}\!\left({5 \over 12},{11 \over 12};{1 \over 3},{1 \over 2},{5 \over 6};-{4x^{6} \over 729}\right)\\&{}\quad {}-{x^{2} \over 3\pi }\,{_{3}F_{4}}\!\left({3 \over 4},{1},{5 \over 4};{2 \over 3},{5 \over 6},{7 \over 6},{4 \over 3};-{4x^{6} \over 729}\right)\\&{}\quad {}+{7x^{4} \over 81\pi }\,\Gamma \left({4 \over 3}\right){_{2}F_{3}}\!\left({13 \over 12},{19 \over 12};{7 \over 6},{3 \over 2},{5 \over 3};-{4x^{6} \over 729}\right),\end{aligned}}}$

که در آن ${\Gamma (x)}$ همان تابع گاما (Gamma Function) است. همچنین $_mF_n()$ نیز «تابع فوق هندسی» (Hypergeometric Function) است.

خصوصیات خانواده توزیع های پایدار

با توجه به خصوصیات جالبی که این توزیع‌ها دارند، چند ویژگی مهم آن‌ها را معرفی می‌کنیم. در این توزیع‌ها ممکن است واریانس و حتی میانگین (امید ریاضی) وجود نداشته باشد. این خاصیت را برحسب پارامتر $\alpha$ به شکل زیر بیان می‌کنیم.

$\large \begin{cases}E|X|^r < \infty\;, & 0 < \alpha \\E|X|^r= \infty\;, & r \geq \alpha \end{cases}$

به این ترتیب مشخص می‌شود که برای توزیع هولستمارک واریانس و برای توزیع کوشی و لوی میانگین وجود ندارد.

از طرفی اگر $X\sim S(\alpha,\beta,c,\mu)$ باشد آنگاه برای هر عدد حقیقی $a$ رابطه زیر برقرار است.

$\large X+a \sim S(x;\alpha,\beta,c,\mu+a)$

همچنین می‌توان گفت که اگر متغیرهای تصادفی $X_i \sim S(x; \alpha, \beta_i,c_i,\mu_i)$ باشند، آنگاه برای $i=1,2$ خواهیم داشت.

$\large X_1+X_2 \sim S(x;\alpha,\beta,c , \mu)$

که در آن $\beta=\frac{\beta_1c_1^{\alpha}+\beta_2c_2^{\alpha}}{c_1^{\alpha}+c_2^{\alpha}}$ ، $c = \left({c_1^{\alpha}+c_2^{\alpha}}\right)^{\frac{1}{\alpha}}$ و $\mu=\mu_1+\mu_2$ است.

اگر به فراگیری مباحث مشابه مطلب بالا علاقه‌مند هستید، آموزش‌هایی که در ادامه آمده‌اند نیز به شما پیشنهاد می‌شوند:

بر اساس رای ۷ نفر

آیا این مطلب برای شما مفید بود؟

اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

ثبت نظر

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.