توزیع ویشارت و متغیر تصادفی آن – مفاهیم و کاربردها


در نظریه «توزیعهای آماری» (Distribution Theory)، «توزیع ویشارت» (Wishart Distribution) را میتوان به شکلی تعمیم یافته «توزیع گاما» (Gamma Distribution) در حالت چند متغیره محسوب کرد. این نام از این جهت برای توزیع ویشارت و متغیر تصادفی آن انتخاب شده است که برای اولین بار توصیف و به کارگیری این توزیع توسط ریاضیدان و متخصص آمار کشاورزی، «جان ویشارت» (John Wishart) در سال ۱۹۲۸ صورت گرفته است.
مقدارهای متغیر تصادفی ویشارت (تکیهگاه - Support)، تشکیل یک ماتریس «متقارن» (Symmetric) و «معین نامنفی» ( Non-negative Definite Matrix) را میدهند. اغلب از این توزیع برای برآورد ماتریس کوواریانس توزیع نرمال چند متغیره، در استنباط آمار بیزی استفاده میشود زیرا می توان آن را به عنوان توزیع مزدوج پیشین معکوس ماتریس کوواریانس (ماتریس دقت) در توزیع نرمال چند متغیره به کار برد.
به عنوان مقدمه و فهم سادهتر این نوشتار، بهتر است مطلب توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها و متغیر تصادفی و توزیع کای 2 (Chi Squared) — مفاهیم و کاربردها را مطالعه کنید. همچنین خواندن استنباط و آمار بیزی — به زبان ساده و توزیع های آماری گاما و بتا — مفاهیم و کاربردها نیز خالی از لطف نیست.
توزیع ویشارت و متغیر تصادفی آن
فرض کنید که یک ماتریس است که مقدار هر ستون آن از یک توزیع نرمال متغیره با میانگین صفر انتخاب شده است.
در این صورت رابطه زیر را خواهیم داشت.
مشخص است که در اینجا منظور از ماتریس کوواریانس است. در این صورت که یک ماتریس بوده و توسط رابطه زیر معرفی میشود، دارای توزیع ویشارت خواهد بود.
در این صورت توزیع ماتریس که به «ماتریس پراکندگی» (Scatter Matrix) نیز مشهور است به صورت زیر نشان داده میشود و میخوانیم دارای توزیع ویشارت متغیره با پارامترهای و است.
همانگونه که دیده میشود این توزیع دارای دو پارامتر و است. همانطور که گفته شد، ماتریس مربوط به ماتریس واریانس-کوواریانس توزیع نرمال چند متغیره است و نیز تعداد ستونهای ماتریس متغیر تصادفی ویشارت را نشان میدهد که به «درجه آزادی» (Degree of Freedom) معروف است.
نکته: گاهی نماد به کار رفته برای این توزیع به صورت زیر است.
مشخص است که در توزیع ویشارت اگر ماتریس «تقریبا همه جا» یا «تقریبا مطمئن» (Almost Surely - With Probability 1) معکوسپذیر است اگر معکوسپذیر باشد.
تابع چگالی احتمال متغیر تصادفی ویشارت
اگر باشد، شکل تابع چگالی احتمال آن در حالت چند متغیره به صورت زیر است.
که در آن تابع گامای چند متغیره بوده و مطابق رابطه زیر بدست میآید.
مشخص است که در اینجا منظور از نیز تابع گامای یک متغیره است. از طرفی نیز، دترمینان ماتریس و نیز «اثر» (Trace) ماتریس را محاسبه میکند.
امید ریاضی و واریانس متغیر تصادفی ویشارت
با توجه به توزیع و چگالی متغیر تصادفی ویشارت، امید ریاضی و مولفههای ماتریس واریانس-کوواریانس آن مطابق با رابطههای زیر خواهد بود.
در اینجا منظور از درایه مربوط به سطر ام و ستون ماتریس است. همچنین «میزان بینظمی» (Information Entropy) یا اطلاع برابری متغیر تصادفی با توزیع ویشارت مطابق با رابطه زیر محاسبه میشود.
که با توجه به ضریب نرمالسازی بدست میآید. البته این ضریب نیز طبق رابطه زیر محاسبه و در فرمول بالا به کار میرود.
به این ترتیب با کمی محاسبات جبری میتوان به شکل زیر، فرم سادهتری برای بینظمی متغیر تصادفی با توزیع ویشارت زیر نوشت:
توزیع حاشیهای متغیر تصادفی ویشارت
فرض کنید ماتریس به صورت و بیانگر ماتریس کوواریانس باشد که در آن ;i همان ضریب همبستگی بین سطرها و ستونها است. در این حال ماتریس که همان ماتریس واریانس-کووریانس توزیع نرمال دو متغیره است، به شکل زیر خواهد بود.
در این صورت نمونه تصادفی از توزیع ویشارت به صورت زیر نوشته میشود.
که در آن دارای توزیع نرمال تک متغیره استاندارد (با میانگین صفر و واریانس ۱) و نیز دارای «توزیع مربع کای» (Chi Square) با درجه آزادی است. همچنین هم دارای توزیع کای ۲ با درجه آزادی خواهد بود. به این ترتیب خواهیم داشت:
به این صورت واضح است که عناصر روی قطر اصلی (توزیع حاشیهای) دارای توزیعی برحسب کای ۲ خواهند بود.
ارتباط با توزیعهای دیگر
توزیع ویشارت را در حالت تک بُعدی در نظر بگیرید. در این حالت اگر باشد، توزیع ویشارت تبدیل به توزیع کای ۲ خواهد شد. در این صورت همان توزیع کای ۲ با درجه آزادی است.
همچنین میتوان توزیع ویشارت را مرتبط با توزیع ویشارت معکوس دانست به این ترتیب اگر دارای توزیع ویشارت بُعدی با پارامترهای و باشد، آنگاه دارای توزیع ویشارت معکوس با پارامترهای و است.
در «استنباط و آمار بیزی» (Bayesian Inference)، توزیع ویشارت به عنوان مزدوج پسین پارامتر دقت (ماتریس واریانس-کوواریانس) برای توزیع نرمال چند متغیره محسوب میشود.
توزیع نرمال-ویشارت
یکی از توزیعهای مهم در نظریه آمار و احتمال، توزیع نرمال-ویشارت (Normal-Wishart Distribution) یا «توزیع گاوسی-ویشارت» (Gaussian-Wishart Distribution) است. این توزیع چند متغیره دارای چهار پارامتر بوده و تکیههای آن مقدارهای پیوسته است. بنابراین متغیر تصادفی مربوط به آن در گروه متغیرهای تصادفی پیوسته قرار میگیرد. این توزیع در آمار بیز، مزدوج پیشین توزیع نرمال چند متغیره با میانگین و ماتریس کوواریانس نامعلوم است. به این ترتیب مشخص است که این متغیر تصادفی باید دو وجهی باشد. فرض کنید بُعد اول را با و بُعد دوم نیز باشد. به این ترتیب متغیر تصادفی دارای توزیع نرمال ویشارت است اگر تابع احتمال آن به صورت زیر باشد. واضح است که در بعد اول مقدارهای حقیقی و در بعد دوم نیز مقدارهای مثبت مجاز هستند.
در این حالت مینویسیم:
.
واضح است که توزیع نرمال-ویشارت دارای چهار پارامتر است. پارامتر برداری بُعدی است که پارامتر مکان نامیده میشود. نیز مقداری حقیقی مثبت و پارامتر مقیاس و یک ماتریس معین مثبت است. همچنین نیز مقداری بزرگتر از خواهد بود.
اگر مطلب بالا برای شما مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش مقدماتی آمار بیزی
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- قضیه بیز در احتمال شرطی و کاربردهای آن
- احتمال پسین (Posterior Probability) و احتمال پیشین (Prior Probability) — به زبان ساده
- تابع درستنمایی (Likelihood Function) و کاربردهای آن — به زبان ساده
^^
سلام ممنون از آموزش خوبتون
ببخشید توزیع دو متغیره ویشارت موجوده؟