متغیر تصادفی و توزیع وایبل (Weibull Distribution) — به زبان ساده
متغیر تصادفی «وایبل» (Weibull) یک متغیر تصادفی با مقادیر پیوسته است. تکیهگاه این متغیر تصادفی، اعداد حقیقی نامنفی است در نتیجه در مواردی که متغیر تصادفی مربوط به طول عمر باشد، میتوان از این توزیع استفاده کرد. هر چند این توزیع اولین بار توسط «فرچه» (Frechet) دانشمند فرانوسی در سال ۱۹۲۷ معرفی شد ولی نام این توزیع برگرفته از نام دانشمند و ریاضیدان سوئدی «والدی وایبل» (Waloddi Weibull) است که در سال ۱۹۵۱ به بررسی کامل این توزیع پرداخت. همچنین «روزین و راملر» (Rosin & Rammler) در سال ۱۹۳۳ با استفاده از این توزیع، اندازه ذرات مواد در سنگهای معدن را مورد بررسی قرار دادند. گاهی توزیع وایبل را به صورت «توزیع وایبول» نیز مینویسند.
از آنجایی که در این نوشتار از متغیر تصادفی و تابع احتمال صحبت به میان خواهد آمد بهتر است ابتدا مطلب متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و قابلیت اعتماد (Reliability) برای سامانههای منسجم — به زبان ساده را مطالعه کرده باشید. از طرفی خواندن نوشتارهای متغیر تصادفی و توزیع نمایی — به زبان ساده و نوشتار امید ریاضی (Mathematical Expectation) — مفاهیم و کاربردها نیز خالی از لطف نیست.
متغیر تصادفی و توزیع وایبل
متغیر تصادفی وایبل و توزیع آن کاربردهای زیادی بخصوص در «تحلیل بقا» (Survival Analysis) و همچنین «قابلیت اعتماد» (Reliability) دارد. بنابراین در حوزههای برق و سیستمهای کنترل و همچنین پیشبینی آب و هوا به کار گرفته میشود. در این نوشتار به بررسی این متغیر تصادفی خواهیم پرداخت و خصوصیات آن را مرور خواهیم کرد.
اگر متغیر تصادفی دارای تکیهگاه با مقدارهای نامنفی و پیوسته باشد، بطوری که تابع چگالی آن به شکل زیر نوشته شود، آنگاه میگوییم این متغیر تصادفی دارای توزیع وایبل با پارامترها و است.
در رابطه بالا، «پارامتر مقیاس» (Scale Parameter) و نیز «پارامتر شکل» (Shape Parameter) است. در این حالت مینویسیم و میخوانیم «متغیر تصادفی دارای توزیع وایبل با پارامترهای لاندا و کا است.» هر دو این پارامترها نیز مقدارهای مثبت دارند. نمودار تابع چگالی این متغیر تصادفی در تصویر زیر قابل مشاهده است.
در این نمودار به خوبی مثبت بودن مقادیر متغیر تصادفی دیده میشود. همچنین شکل این توزیع با افزایش پارامتر به سمت توزیع نرمال میل میکند. همانطور که در تصویر دیده میشود، با تغییر مقدار پارامتر ، شکل تابع چگالی احتمال برای این متغیر تصادفی تغییر میکند.
- زمانی که باشد، تابع چگالی با نزدیک شدن مقدار به صفر به سمت بینهایت میل میکند. از آنجایی که در این حالت توان یعنی ، در تابع چگالی منفی است ()، نمودار آن به صورت نزولی است. در چنین حالتی، شیب منحنی در نزدیکی ، منفی بینهایت است.
- اگر باشد قسمت مربوط به از چگالی حذف شده و متغیر تصادفی دارای توزیع نمایی با نرخ شکست خواهد شد. در این حالت تابع چگالی با نزدیک شدن به صفر، به سمت میل میکند. در تصویر با توجه به مقدار تابع چگالی احتمال در نقطه به مقدار ۱ رسیده است.
- به ازاء مقدار ، با نزدیک شدن مقدار به سمت صفر تابع چگالی نیز به صفر میل میکند. به این ترتیب با افزایش مقدار تا رسیدن به مقدار نما (Mode) توزیع، تابع چگالی صعودی و پس از آن نزولی خواهد شد. زمانی که باشد شیب منحنی در زمانی که به سمت صفر میل میکند به سمت مثبت بینهایت میرود. از طرفی زمانی که باشد، شیب منحنی تابع چگالی در برابر با صفر است.
اگر متغیر تصادفی بیانگر «زمان شکست» (Failure Time) باشد، توزیع وایبل میتواند برای توصیف این متغیر تصادفی به کار رود، بطوری که نرخ شکست، متناسب با زمان و به صورت نمایی است. در این حالت پارامتر میتواند نشانگر «متوسط نرخ شکست» (Mean Failure Rate) باشد.
- اگر باشد، بیانگر نزولی بودن نرخ شکست است. به این معنی که با گذشت زمان، احتمال شکست برای پدیدهای با این خصوصیت کاهش مییابد.
- اگر باشد، نرخ شکست به صورت ثابت خواهد بود.
- برای نیز میتوان صعودی بودن نرخ شکست را در نظر گرفت. به این ترتیب با طول عمر بیشتر، احتمال شکست یا خطا افزایش مییابد.
تابع توزیع تجمعی (CDF) برای متغیر تصادفی وایبل به صورت زیر نوشته میشود.
همچنین نمودار مربوط به تابع توزیع تجمعی این متغیر تصادفی در تصویر زیر دیده میشود.
تابع توزیع تجمعی متغیر تصادفی وایبل، زمانی که باشد، برابر با به ازاء همه مقدارهای خواهد بود. از طرف دیگر اگر مقدار تابع توزیع تجمعی متغیر تصادفی وایبل برابر با باشد میتوان نتیجه گرفت که تقریبا است.
توزیع وایبل سه پارامتری
اگر در توزیع وایبل، «پارامتر مکان» (Location Parameter) را با نام وارد کنیم، توزیع وایبل سه پارامتری خواهیم داشت. در این حالت تابع چگالی متغیر تصادفی وایبل سه پارامتری و به شکل زیر خواهد بود.
توجه داشته باشید که در این توزیع باید باشد. به این ترتیب «پارامتر مکان» (Location) و «پارامتر شکل» (Shape Parameter) و در انتها نیز ، «پارامتر مقیاس» (Scale Parameter) خواهد بود. واضح است که پارامترهای شکل و مقیاس باید مثبت باشند.
نکته: چنانچه مقدار پارامتر مکان () برابر با صفر باشد، توزیع به حالت دو پارامتری درخواهد آمد.
خصوصیات متغیر تصادفی وایبل
با توجه به تعریف امید ریاضی، میتوان مقدارهای «مورد انتظار» (Expected Value) و «واریانس» (Variance) را برای متغیر تصادفی با توزیع وایبل، محاسبه کرد.
البته میتوان شیوه نوشتن واریانس را به شکل سادهتری نیز انجام داد. در این حالت واریانس برحسب مربع امید ریاضی نوشته خواهد شد.
نکته: در روابط بالا که مربوط به امید ریاضی و واریانس متغیر تصادفی وایبل است منظور از تابع گاما است.
همچنین میتوان بین توزیع وایبل و توزیع یکنواخت ارتباطی پیدا کرد. فرض کنید آنگاه با تعریف زیر دارای توزیع وایبل با پارامترهای و است.
توزیع وایبل نمایی شده (Exponentiated Weibull Distribution)
در سال ۱۹۹۳ «ماهولکار» (Mudholkar) و «سیرواستاوا» (Srivastava) به بررسی توزیعی گسترش یافته از توزیع وایبل پرداختند که آن را «توزیع وایبل نمایی شده» (Exponentiated Weibull Distribution) نامیدند.
در این توزیع «پارامتر شکل» (Shape Parameter) دیگری نیز اضافه شده است. تابع چگالی این توزیع به صورت زیر است.
مشخص است که در این توزیع را پارامتر شکل اول و را پارامتر شکل دوم مینامند. اگر مقدار برابر با ۱ باشد، توزیع به صورت وایبل دو پارامتری درخواهد آمد. همچنین تابع توزیع تجمعی برای چنین متغیر تصادفی به صورت زیر نوشته میشود.
میتوان نشان داد که متغیر تصادفی با «توزیع وایبل نمایی شده» دارای تابع نرخ خطر صعودی-نزولی و به شکل Bathtub (وانی شکل) است. بنابراین میتواند برای بسیاری از پدیدههای رشد در جوامع انسانی به کار گرفته شود.
برای مثال دوره زندگی یک انسان دارای نرخ خطر صعودی-نزولی و به شکل وان (Bathtub) است. در ابتدای دوره نوزادی، امکان فوت در اثر بیماریها و خطرات محتمل زیاد است و بنابراین نوزاد احتیاج به مراقبت بیشتری دارد. در دوره کودکی این نرخ کاهش یافته و تا دوره میانسالی تقریبا ثابت است. با گذر از دوره میانسالی و در حدود ۵۰ سالگی این نرخ مجدد افزایش خواهد یافت.
کاربردهای توزیع وایبل
در ادامه به ذکر مثالهایی خواهیم پرداخت که با توزیع وایبل در ارتباط است. هرچند نرمافزارهای آماری متعددی برای انجام محاسبات مربوط به توزیعهای آماری وجود دارد، ولی در اینجا به علت سهولت و سادگی نرمافزار اکسل، برای انجام محاسبات مربوط به این مثالها از آن کمک خواهیم گرفت.
مثال ۱
توزیع طول عمر یک صفحه نمایش حساس رایانهای از توزیع وایبل با پارامترهای ساعت و پیروی میکند. احتمال آنکه صفحه نمایش بیش از ۵۰۰۰ ساعت عمر کند، چقدر است؟ میانگین طور عمر آن را نیز محاسبه کنید.
مشخص است که در این مثال به دنبال محاسبه رابطه زیر هستیم.
ولی به کمک ویژگیهای که تابع توزیع احتمال دارد، میتوانیم براساس فرمول زیر احتمال بالا را بدست آوریم.
برای پاسخ به این سوال از توابع آماری اکسل استفاده میکنیم. برای محاسبه احتمال (تابع توزیع تجمعی) وایبل باید از تابع WEIBULL.DIST استفاده کنیم. پارامترهای این دستور به صورت زیر است.
1WEIBULL.DIST(x,alpha,beta,cumulative)
در این تابع مقداری است که باید در آن تابع WEIBULL.DIST محاسبه شود. طبیعتا این مقدار باید مثبت باشد. از طرفی پارامتر alpha نیز همان پارامتر مقیاس () در تعریف توزیع متغیر تصادفی وایبل است. همینطور beta نیز بیانگر پارامتر شکل () است. پارامتر آخر (cummulative) نیز یک مقدار منطقی است. اگر این پارامتر، TRUE باشد، تابع WEIBULL.DIST، مقدار تابع توزیع تجمعی احتمال را در نقطه محاسبه میکند. همچنین با تعیین مقدار FALSE برای این پارامتر، تابع چگالی احتمال وایبل در نقطه بدست خواهد آمد.
WEIBULL(x, β, α, FALSE) = Probability Density Function of Weibull Distribtion f(x) at x
WEIBULL(x, β, α, TRUE) = Weibull cumulative distribution function F(x) at x
بنابراین برای پاسخ به سوال مطرح شده از فرمول زیر کمک میگیریم.
1= WEIBULL.DIST(5000, .6, 1000, TRUE) = 0.92767.
همانطور که دیده میشود احتمال اینکه این صفحه نمایش کمتر از ۵۰۰۰ ساعت عمر کند بسیار زیاد است زیرا متوسط زمان خرابی در آن ۱۰۰۰ ساعت در نظر گرفته شده است. در نتیجه مکمل این پیشامد یعنی طول عمری بیش از ۵۰۰۰ ساعت برابر است با که به نظر بسیار کوچک میآید. این احتمال نشان میدهد که فقط حدود ۷٪ از این نمایشگرها طول عمری بیشتر از ۵۰۰۰ ساعت دارند.
همینطور، محاسبه میانگین (امید ریاضی) برای این توزیع به صورت زیر است.
این رابطه را مطابق با فرمول زیر در اکسل محاسبه میکنیم. امید ریاضی چنین متغیری را گاهی با MTTF یا «میانگین زمان خرابی» (Mean Time To Failure) نیز نشان میدهند.
1=1000*GAMMA(1 + 1/.6)) = 1,504.575
نکته: در اینجا منظور از GAMMA همان تابع گاما است.
مثال ۲
اگر میانگین زمان خرابی برای یک مولفه با توزیع وایبل برابر با ۱۰۰۰ ساعت و انحراف استاندارد ۴۰۰ ساعت باشد، احتمال اینکه این مولفه بیش از ۲۰۰۰ ساعت کار کند چقدر است؟
ابتدا لازم است که برای توزیع وایبل با این مشخصات، پارامتر و را بدست آورده و مطابق با تابع توزیع تجمعی، چنین احتمالی را محاسبه کنیم. این کار را به کمک دو رابطه زیر انجام میدهیم.
رابطه ۱
از طرفی مطابق با شیوه محاسبه واریانس داریم:
رابطه ۲
در نتیجه رابطه زیر برقرار است:
پس مطابق با رابطه ۱ و ۲ میتوانیم به معادلههای زیر را بنویسیم.
رابطه ۳
و همچنین
رابطه ۴
در نتیجه اگر دو برابر رابطه ۳ را از رابطه ۴ کم کنیم میتوانیم پارامتر را دستگاه حاصل از بین ببریم و معادله را فقط برحسب پارامتر حل کنیم.
که درست مطابق با حال معادله زیر است.
به منظور حل این معادله از ابزار Goal Seek اکسل کمک میگیریم. کافی است با توجه به تصویر زیر اطلاعات را در کاربرگ ثبت و پنجره Goal Seek را مطابق تصویر تنظیم کنیم. برای دسترسی به این ابزار کافی است از برگه Data، قسمت What-if-Analysis را انتخاب و گزینه Goal Seek را اجرا کنید. پنجرهای مطابق تصویر زیر باز خواهد شد.
در کادر Set cell باید آدرس سلولی که دارای فرمول بوده و باید مقدار آن به پارامتر To value برسد مشخص میشود. همچنین پارامتر By changing cell آدرس سلولی را تعیین میکند که باید تغییر کرده تا پارامتر Set cell به مقدار To value برسد. واضح است که در اینجا پارامتر Set cell یک سلول وابسته است که آدرس سلول پیشنیاز آن در پارامتر by changing cell تعیین شده است.
نکته: برای حل این معادله ابتدا به سلول B3 که هدف، بدست آوردن آن است، مقداری اختیاری (مثلا ۱) نسبت داده تا ابزار Goal Seek بتواند معادله را حل کند.
پس از فشردن دکمه OK، اکسل با مقدار دهی به سلول B3، سعی میکند مقدار سلول B4 را به صفر نزدیک کند. نتیجه این تلاش در تصویر زیر دیده میشود.
به این ترتیب مقدار پارامتر lambda تقریبا برابر با 2.6883 میباشد. به همین ترتیب براساس محاسبات صورت گرفته در کاربرگ مقدار پارامتر k نیز طبق فرمول نوشته شده در سلول B4 محاسبه میشود که برابر با 1124.667 است.
به این ترتیب به کمک تابع زیر میتوانیم مقدار احتمال را براساس این پارامترها بدست آوریم.
1=1-WEIBULL.DIST(2000,B3,B5,TRUE)
اگر به فراگیری مباحث مشابه مطلب بالا علاقهمند هستید، آموزشهایی که در ادامه آمدهاند نیز به شما پیشنهاد میشوند:
چرا راجع به پارامتر مقیاس صحبت نشد اگر امکانش هست توضیح بدید؟
سلام
ی سوال داشتم پارامترمکان چه چیزی رو بیان میکنه، و درواقع اصلا چی هستش که تو توزیع استفاده میکنن؟