خانواده توزیع های پایدار — مفاهیم اولیه

۶۶۴ بازدید
آخرین به‌روزرسانی: ۰۹ خرداد ۱۴۰۲
زمان مطالعه: ۵ دقیقه
خانواده توزیع های پایدار — مفاهیم اولیه

«خانواده توزیع‌ های پایدار» (Stable Distribution Family) به مانند «خانواده نمایی» (Exponential Family) دارای خصوصیات جالبی است که اعضای این خانواده از توزیع‌ها را نسبت به دیگر خانواده‌ها متمایز می‌کند. نظریه خانواده توزیع های پایدار ابتدا در سال ۱۹۲۴ توسط آمارشناس فرانسوی «پائول لوی» (Paul Levy) معرفی و مطرح شد. بعدها با توجه به اهمیت این توزیع‌ها در دنیای واقعی، توجه آمارشناسان به آن‌ها بیشتر شد بطوری که «قضیه حد مرکزی تعمیم یافته» (Generalized Central Limit Theorem) نقطه عطفی برای این خانواده از توزیع‌ها محسوب می‌شود.

997696

در این نوشتار به معرفی و بررسی بعضی از خصوصیات خانواده توزیع های پایدار خواهیم پرداخت. به این منظور به عنوان مقدمه بهتر است نوشتارهای توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها و متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده را مطالعه کنید. البته خواندن مطلب توزیع های آماری F و T — مفاهیم و کاربردها و متغیر تصادفی و توزیع کای 2 (Chi Squared) — مفاهیم و کاربردها نیز خالی از لطف نیست.

خانواده توزیع های پایدار

در نظریه آمار، توزیع احتمال را پایدار گویند اگر ترکیبی خطی از دو متغیر تصادفی با توزیع مذکور دارای همان توزیع باشد. البته ممکن است در این بین پارامترهای مکان یا مقیاس تغییر کنند ولی توزیع ثابت باقی می‌ماند. به زبان ریاضی می‌توان این خصوصیت را به صورت زیر بیان کرد.

توزیع های پایدار (Stable Distribution)

اگر X1X_1 و X2X_2 دو نسخه مستقل از متغیر تصادفی XX با توزیع ff باشند، چنانچه رابطه زیر برقرار باشد توزیع ff را پایدار ‌می‌گویند.

\large aX_1+bX_2 \stackrel{D}{\sim}cX +d,\;\; a,b,c >0

این امر نشان می‌دهد که توزیع متغیرهای تصادفی نسبت به ترکیب خطی در این خانواده بسته است.

نکته: اگر مقدار dd صفر باشد توزیع را «اکیدا پایدار» (Strictly Stable) می‌نامند.

توزیع‌هایی مانند توزیع نرمال (Normal Distribution)، کوشی (Cauchy Distribution) و «توزیع لوی» (Levy Distribution) از اعضای این خانواده از توزیع‌ها هستند.

برای نمایش این توزیع‌ها اغلب از «تابع مشخصه» (Characteristic Function) استفاده می‌شود. برای متغیر تصادفی XX تابع مشخصه به صورت زیر نوشته و محاسبه می‌شود.

{φX ⁣:RCφX(t)=E[eitX]=ReitxdFX(x)\large {\displaystyle {\begin{cases}\varphi _{X}\!:\mathbb {R} \to \mathbb {C} \\\varphi _{X}(t)=\operatorname {E} \left[e^{itX}\right]=\int _{\mathbb {R} }e^{itx}\,dF_{X}(x)\end{cases}}}

در اینجا منظور از FXF_X همان توزیع تجمعی متغیر تصادفی XX و انتگرال هم انتگرال ریمان-استیلت‌یس است.

جدول زیر به بعضی از توابع مشخصه توزیع‌های مهم پرداخته است.

توزیعتابع مشخصه
توزیع برنولی ⁣1p+peit\large {\displaystyle \!\,1-p+pe^{it}}
توزیع دو جمله‌ای ⁣(1p+peit)n\large {\displaystyle \!\,(1-p+pe^{it})^{n}}
توزیع دو جمله‌ای منفی(1p1peit) ⁣r\large{\displaystyle \,{\biggl (}{\frac {1-p}{1-pe^{i\,t}}}{\biggr )}^{\!r}}
توزیع یکنواخت (گسسته)eaite(b+1)it(ba+1)(1eit)\large{\displaystyle {\frac {e^{ait}-e^{(b+1)it}}{(b-a+1)(1-e^{it})}}}
توزیع یکنواخت (پیوسته) ⁣eitbeitait(ba)\large{\displaystyle \!\,{\frac {e^{itb}-e^{ita}}{it(b-a)}}}
توزیع لاپلاس ⁣eitμ1+b2t2\large{\displaystyle \!\,{\frac {e^{it\mu }}{1+b^{2}t^{2}}}}
توزیع نرمال ⁣eitμ12σ2t2 ⁣eitμ12σ2t2\large {\displaystyle \!\,e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}} {\displaystyle \!\,e^{it\mu -{\frac {1}{2}}\sigma ^{2}t^{2}}}
توزیع کای ۲ ⁣(12it)k/2\large {\displaystyle \!\,(1-2it)^{-k/2}}
توزیع کوشیeitμθt\large {\displaystyle e^{it\mu -\theta |t|}}
توزیع گاما(1itθ)k\large {\displaystyle (1-it\theta )^{-k}}
توزیع نمایی ⁣(1itλ1)1\large{\displaystyle \!\,(1-it\lambda ^{-1})^{-1}}

براساس تابع مشخصه می‌توان تابع چگالی متغیر تصادفی XX را به کمک تبدیل فوریه (Fourier Transform) بدست آورد. به این ترتیب رابطه زیر بین تابع مشخصه و تابع چگالی برقرار است.

f(x)=12πφ(t)eixtdt\large f(x)=\frac{1}{2\pi}\int_{-\infty}^\infty \varphi(t)e^{-ixt}\,dt

تابع مشخصه برای خانواده توزیع های پایدار

توزیع‌های پایدار با چهار پارامتر شناخته می‌شوند. پارامتر اول α\alpha یا پارامتر پایداری (Stable Parameter)  نامیده می‌شود که مقداری در بازه (0,2](0,2] است. هر چه مقدار α\alpha به صفر نزدیک شود توزیع دارای دم‌های کلفت‌تری خواهد بود بطوری که احتمال مشاهده مقدارهای بزرگ بیشتر خواهد شد.

پارامتر دوم β\beta است، که پارامتر «چولگی» (Skewness) نامیده شده و در بازه [1,1][-1,1] قرار گرفته. این پارامتر میزان تقارن را برای توزیع مشخص می‌کند. اگر β=0\beta=0 باشد، توزیع متقارن خواهد بود. از آنجایی که α\alpha و β\beta شکل توزیع را مشخص می‌کنند، به آن‌ها پارامترهای شکل (Shape Parameters) نیز می‌گویند.

در ادامه به ترتیب μ\mu پارامتر مکان بوده و cc نیز پارامتر مقیاس و نامنفی است. به این ترتیب تابع مشخصه برای توزیع پایدار به صورت زیر نوشته خواهد شد.

φ(t;α,β,c,μ)=exp(itμctα(1iβsgn(t)Φ))\large {\displaystyle \varphi (t;\alpha ,\beta ,c,\mu )=\exp \left(it\mu -|ct|^{\alpha }\left(1-i\beta \operatorname {sgn}(t)\Phi \right)\right)}

که در آن Φ\Phi به صورت زیر حاصل می‌شود.

Φ={tan(πα2)amp;α12πlogtamp;α=1\large {\displaystyle \Phi ={\begin{cases}\tan \left({\frac {\pi \alpha }{2}}\right)&\alpha \neq 1\\-{\frac {2}{\pi }}\log |t|&\alpha =1\end{cases}}}

نکته: تابع sgn همان تابع علامت است که در صورت منفی بودن پارامتر آن مقدار 1-1 و در صورت مثبت بودن پارامتر آن مقدار +1+1 خواهد داشت. البته اگر t=0t=0 باشد مقدار تابع علامت هم صفر در نظر گرفته می‌شود.

در این صورت متغیر تصادفی XX را دارای توزیع پایدار گویند و آن را به صورت زیر نمایش می‌دهند.

XS(x;α,β,c,μ) \large X \sim S(x; \alpha, \beta ,c, \mu)

از آنجایی که محاسبه انتگرال بالا برای پیدا کردن تابع چگالی، برای همه مقادیر پارامترها امکان‌پذیر نیست در بیشتر مواقع اعضای خانواده توزیع‌های پایدار را با تابع مشخصه براساس چهار پارامتر گفته شده، معرفی می‌کنند. در ادامه به معرفی چهار توزیع پایدار می‌پردازیم که تابع چگالی آن‌ها به کمک انتگرال‌گیری مشخص می‌شود.

توزیع نرمال (Normal Distribution)

اگر XX متغیر تصادفی با توزیع پایدار با پارامترهای α=2\alpha=2 و σ2=2c2\sigma^2=2c^2 به عنوان پارامتر واریانس یا مقیاس و μ\mu به عنوان پارامتر مرکزی باشد، دارای توزیع نرمال با میانگین μ\mu و واریانس σ2\sigma^2 است. در نتیجه تابع چگالی آن به شکل زیر درخواهد آمد.

f(xμ,σ2)=12πσ2e(xμ)22σ2\large {\displaystyle f(x\mid \mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}

همانطور که مشخص است در اینجا پارامتر چولگی β\beta هیچ تاثیری در توزیع ندارد.

توزیع کوشی (Cauchy Distribution)

متغیر تصادفی XX با توزیع پایدار با پارامترهای α=1\alpha=1 و β=0\beta=0 دارای توزیع کوشی با پارامترهای مقیاس cc و مکان μ\mu است.

به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.

f(x;μ,c)=1πc[1+(xμc)2]=1πc[c2(xμ)2+c2]\large f(x;\mu,c)={\frac {1}{\pi c \left[1+\left({\frac {x-\mu}{c}}\right)^{2}\right]}}={1 \over \pi c}\left[{c^{2} \over (x-\mu)^{2}+c^{2}}\right]

توزیع لوی (Levy Distribution)

متغیر تصادفی XX با توزیع پایدار با پارامترهای α=12\alpha=\frac{1}{2} و β=1\beta=1 دارای توزیع لوی با پارامترهای مقیاس cc و مکان μ\mu است. به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.

f(x;μ,c)=c2π  ec2(xμ)(xμ)3/2,    xμ\large f(x;\mu,c)=\sqrt{\frac{c}{2\pi}}~~\frac{e^{ -\frac{c}{2(x-\mu)}}} {(x-\mu)^{3/2}}, \;\; x\geq \mu

توزیع هولتسمارک (Holtsmark Distribution)

متغیر تصادفی XX با توزیع پایدار با پارامترهای α=۳2\alpha=\frac{۳}{2} و β=0\beta=0 دارای توزیع هولتسمارک با پارامترهای مقیاس cc و مکان μ\mu است. به این ترتیب تابع چگالی آن به ازاءmu=0mu=0 و σ=1\sigma=1 به صورت زیر نوشته خواهد شد.

f(x;0,1)amp;=1πΓ(53)2F3 ⁣(512,1112;13,12,56;4x6729)amp;x23π3F4 ⁣(34,1,54;23,56,76,43;4x6729)amp;+7x481πΓ(43)2F3 ⁣(1312,1912;76,32,53;4x6729),\large {\displaystyle {\begin{aligned}f(x;0,1)&={1 \over \pi }\,\Gamma \left({5 \over 3}\right){_{2}F_{3}}\!\left({5 \over 12},{11 \over 12};{1 \over 3},{1 \over 2},{5 \over 6};-{4x^{6} \over 729}\right)\\&{}\quad {}-{x^{2} \over 3\pi }\,{_{3}F_{4}}\!\left({3 \over 4},{1},{5 \over 4};{2 \over 3},{5 \over 6},{7 \over 6},{4 \over 3};-{4x^{6} \over 729}\right)\\&{}\quad {}+{7x^{4} \over 81\pi }\,\Gamma \left({4 \over 3}\right){_{2}F_{3}}\!\left({13 \over 12},{19 \over 12};{7 \over 6},{3 \over 2},{5 \over 3};-{4x^{6} \over 729}\right),\end{aligned}}}

که در آن Γ(x) {\displaystyle {\Gamma (x)}} همان تابع گاما (Gamma Function) است. همچنین mFn()_mF_n() نیز «تابع فوق هندسی» (Hypergeometric Function) است.

خصوصیات خانواده توزیع های پایدار

با توجه به خصوصیات جالبی که این توزیع‌ها دارند، چند ویژگی مهم آن‌ها را معرفی می‌کنیم. در این توزیع‌ها ممکن است واریانس و حتی میانگین (امید ریاضی) وجود نداشته باشد. این خاصیت را برحسب پارامتر α\alpha به شکل زیر بیان می‌کنیم.

{EXrlt;  ,amp;0lt;αEXr=  ,amp;rα \large \begin{cases}E|X|^r < \infty\;, & 0 < \alpha \\E|X|^r= \infty\;, & r \geq \alpha \end{cases}

به این ترتیب مشخص می‌شود که برای توزیع هولستمارک واریانس و برای توزیع کوشی و لوی میانگین وجود ندارد.

از طرفی اگر XS(α,β,c,μ)X\sim S(\alpha,\beta,c,\mu) باشد آنگاه برای هر عدد حقیقی aa رابطه زیر برقرار است.

X+aS(x;α,β,c,μ+a)\large X+a \sim S(x;\alpha,\beta,c,\mu+a)

همچنین می‌توان گفت که اگر متغیرهای تصادفی XiS(x;α,βi,ci,μi)X_i \sim S(x; \alpha, \beta_i,c_i,\mu_i) باشند، آنگاه  برای i=1,2i=1,2 خواهیم داشت.

X1+X2S(x;α,β,c,μ)\large X_1+X_2 \sim S(x;\alpha,\beta,c , \mu)

که در آن β=β1c1α+β2c2αc1α+c2α \beta=\frac{\beta_1c_1^{\alpha}+\beta_2c_2^{\alpha}}{c_1^{\alpha}+c_2^{\alpha}} ،c=(c1α+c2α)1α c = \left({c_1^{\alpha}+c_2^{\alpha}}\right)^{\frac{1}{\alpha}} و μ=μ1+μ2\mu=\mu_1+\mu_2 است.

اگر به فراگیری مباحث مشابه مطلب بالا علاقه‌مند هستید، آموزش‌هایی که در ادامه آمده‌اند نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۷ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
۱ دیدگاه برای «خانواده توزیع های پایدار — مفاهیم اولیه»

درود بر شما،
املای لاتین کلمه پارامتر در قسمت های مختلف متن، گاها اشتباه نوشته شده

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *