خانواده توزیع های پایدار — مفاهیم اولیه
«خانواده توزیع های پایدار» (Stable Distribution Family) به مانند «خانواده نمایی» (Exponential Family) دارای خصوصیات جالبی است که اعضای این خانواده از توزیعها را نسبت به دیگر خانوادهها متمایز میکند. نظریه خانواده توزیع های پایدار ابتدا در سال ۱۹۲۴ توسط آمارشناس فرانسوی «پائول لوی» (Paul Levy) معرفی و مطرح شد. بعدها با توجه به اهمیت این توزیعها در دنیای واقعی، توجه آمارشناسان به آنها بیشتر شد بطوری که «قضیه حد مرکزی تعمیم یافته» (Generalized Central Limit Theorem) نقطه عطفی برای این خانواده از توزیعها محسوب میشود.
در این نوشتار به معرفی و بررسی بعضی از خصوصیات خانواده توزیع های پایدار خواهیم پرداخت. به این منظور به عنوان مقدمه بهتر است نوشتارهای توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها و متغیر تصادفی و توزیع کوشی (Cauchy Distribution) — به زبان ساده را مطالعه کنید. البته خواندن مطلب توزیع های آماری F و T — مفاهیم و کاربردها و متغیر تصادفی و توزیع کای 2 (Chi Squared) — مفاهیم و کاربردها نیز خالی از لطف نیست.
خانواده توزیع های پایدار
در نظریه آمار، توزیع احتمال را پایدار گویند اگر ترکیبی خطی از دو متغیر تصادفی با توزیع مذکور دارای همان توزیع باشد. البته ممکن است در این بین پارامترهای مکان یا مقیاس تغییر کنند ولی توزیع ثابت باقی میماند. به زبان ریاضی میتوان این خصوصیت را به صورت زیر بیان کرد.
توزیع های پایدار (Stable Distribution)
اگر و دو نسخه مستقل از متغیر تصادفی با توزیع باشند، چنانچه رابطه زیر برقرار باشد توزیع را پایدار میگویند.
این امر نشان میدهد که توزیع متغیرهای تصادفی نسبت به ترکیب خطی در این خانواده بسته است.
نکته: اگر مقدار صفر باشد توزیع را «اکیدا پایدار» (Strictly Stable) مینامند.
توزیعهایی مانند توزیع نرمال (Normal Distribution)، کوشی (Cauchy Distribution) و «توزیع لوی» (Levy Distribution) از اعضای این خانواده از توزیعها هستند.
برای نمایش این توزیعها اغلب از «تابع مشخصه» (Characteristic Function) استفاده میشود. برای متغیر تصادفی تابع مشخصه به صورت زیر نوشته و محاسبه میشود.
در اینجا منظور از همان توزیع تجمعی متغیر تصادفی و انتگرال هم انتگرال ریمان-استیلتیس است.
جدول زیر به بعضی از توابع مشخصه توزیعهای مهم پرداخته است.
توزیع | تابع مشخصه |
توزیع برنولی | |
توزیع دو جملهای | |
توزیع دو جملهای منفی | |
توزیع یکنواخت (گسسته) | |
توزیع یکنواخت (پیوسته) | |
توزیع لاپلاس | |
توزیع نرمال | |
توزیع کای ۲ | |
توزیع کوشی | |
توزیع گاما | |
توزیع نمایی |
براساس تابع مشخصه میتوان تابع چگالی متغیر تصادفی را به کمک تبدیل فوریه (Fourier Transform) بدست آورد. به این ترتیب رابطه زیر بین تابع مشخصه و تابع چگالی برقرار است.
تابع مشخصه برای خانواده توزیع های پایدار
توزیعهای پایدار با چهار پارامتر شناخته میشوند. پارامتر اول یا پارامتر پایداری (Stable Parameter) نامیده میشود که مقداری در بازه است. هر چه مقدار به صفر نزدیک شود توزیع دارای دمهای کلفتتری خواهد بود بطوری که احتمال مشاهده مقدارهای بزرگ بیشتر خواهد شد.
پارامتر دوم است، که پارامتر «چولگی» (Skewness) نامیده شده و در بازه قرار گرفته. این پارامتر میزان تقارن را برای توزیع مشخص میکند. اگر باشد، توزیع متقارن خواهد بود. از آنجایی که و شکل توزیع را مشخص میکنند، به آنها پارامترهای شکل (Shape Parameters) نیز میگویند.
در ادامه به ترتیب پارامتر مکان بوده و نیز پارامتر مقیاس و نامنفی است. به این ترتیب تابع مشخصه برای توزیع پایدار به صورت زیر نوشته خواهد شد.
که در آن به صورت زیر حاصل میشود.
نکته: تابع sgn همان تابع علامت است که در صورت منفی بودن پارامتر آن مقدار و در صورت مثبت بودن پارامتر آن مقدار خواهد داشت. البته اگر باشد مقدار تابع علامت هم صفر در نظر گرفته میشود.
در این صورت متغیر تصادفی را دارای توزیع پایدار گویند و آن را به صورت زیر نمایش میدهند.
از آنجایی که محاسبه انتگرال بالا برای پیدا کردن تابع چگالی، برای همه مقادیر پارامترها امکانپذیر نیست در بیشتر مواقع اعضای خانواده توزیعهای پایدار را با تابع مشخصه براساس چهار پارامتر گفته شده، معرفی میکنند. در ادامه به معرفی چهار توزیع پایدار میپردازیم که تابع چگالی آنها به کمک انتگرالگیری مشخص میشود.
توزیع نرمال (Normal Distribution)
اگر متغیر تصادفی با توزیع پایدار با پارامترهای و به عنوان پارامتر واریانس یا مقیاس و به عنوان پارامتر مرکزی باشد، دارای توزیع نرمال با میانگین و واریانس است. در نتیجه تابع چگالی آن به شکل زیر درخواهد آمد.
همانطور که مشخص است در اینجا پارامتر چولگی هیچ تاثیری در توزیع ندارد.
توزیع کوشی (Cauchy Distribution)
متغیر تصادفی با توزیع پایدار با پارامترهای و دارای توزیع کوشی با پارامترهای مقیاس و مکان است.
به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.
توزیع لوی (Levy Distribution)
متغیر تصادفی با توزیع پایدار با پارامترهای و دارای توزیع لوی با پارامترهای مقیاس و مکان است. به این ترتیب تابع چگالی آن به صورت زیر نوشته خواهد شد.
توزیع هولتسمارک (Holtsmark Distribution)
متغیر تصادفی با توزیع پایدار با پارامترهای و دارای توزیع هولتسمارک با پارامترهای مقیاس و مکان است. به این ترتیب تابع چگالی آن به ازاء و به صورت زیر نوشته خواهد شد.
که در آن همان تابع گاما (Gamma Function) است. همچنین نیز «تابع فوق هندسی» (Hypergeometric Function) است.
خصوصیات خانواده توزیع های پایدار
با توجه به خصوصیات جالبی که این توزیعها دارند، چند ویژگی مهم آنها را معرفی میکنیم. در این توزیعها ممکن است واریانس و حتی میانگین (امید ریاضی) وجود نداشته باشد. این خاصیت را برحسب پارامتر به شکل زیر بیان میکنیم.
به این ترتیب مشخص میشود که برای توزیع هولستمارک واریانس و برای توزیع کوشی و لوی میانگین وجود ندارد.
از طرفی اگر باشد آنگاه برای هر عدد حقیقی رابطه زیر برقرار است.
همچنین میتوان گفت که اگر متغیرهای تصادفی باشند، آنگاه برای خواهیم داشت.
که در آن ، و است.
اگر به فراگیری مباحث مشابه مطلب بالا علاقهمند هستید، آموزشهایی که در ادامه آمدهاند نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش آمار و احتمال مهندسی
- مجموعه آموزشهای نرمافزارهای آماری
- توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها
- توزیع های آماری F و T — مفاهیم و کاربردها
- توزیع های آماری گاما و بتا — مفاهیم و کاربردها
^^
درود بر شما،
املای لاتین کلمه پارامتر در قسمت های مختلف متن، گاها اشتباه نوشته شده