توزیع نرمال بریده شده (Truncated Normal Distribution) – به زبان ساده


در نظریه آمار و احتمال، توزیعهای آماری نقش مهمی در توصیف پدیدههای تصادفی دارند. یکی از توزیعهای آماری که از توزیع نرمال منشعب شده است، «توزیع نرمال بریده شده» (Truncated Normal Distribution) است. البته در ادامه خواهیم دید که توزیع نرمال بریده شده را میتوان حالت کلیتری برای توزیع نرمال در نظر گرفت. فرض کنید متغیر تصادفی دارای توزیع احتمالی نرمال باشد، اگر مجموعه مقادیر این متغیر تصادفی را در بازه محدود کنیم، متغیر تصادفی حاصل دارای توزیع «نرمال بریده شده» خواهد شد. از این توزیع بخصوص در مباحث مربوط به اقتصاد و دادههای مالی استفاده زیادی میشود.
از آنجایی که این توزیع رابطه مستقیمی با توزیع نرمال دارد، خواندن مطلب توزیع نرمال یک و چند متغیره — مفاهیم و کاربردها توصیه میشود. همچنین خواندن مطلب امید ریاضی (Mathematical Expectation) — مفاهیم و کاربردها نیز خالی از لطف نیست.
توزیع نرمال بریده شده
در توزیع نرمال بریده شده، تکیهگاه متغیر تصادفی بازه است. بنابراین اگر دارای توزیع نرمال با میانگین و واریانس باشد، آنگاه با توجه به قید دارای توزیع نرمال بریده شده است.
البته ممکن است یکی از کرانهای بازه بینهایت باشد در این حالت، توزیع نرمال بریده شده یکطرفه (One tail) خواهد بود. اگر بینهایت منفی باشد (کران پایین وجود نداشته باشد) آنگاه توزیع را بریده شده از راست (Right Truncated) مینامند. همچنین اگر کران بالا برای متغیر تصادفی وجود نداشته باشد ولی باشد، توزیع را بریده شده از چپ (Left Truncated) مینامند.
تابع توزیع احتمال و چگالی نرمال بریده شده
با توجه به تعریف متغیر تصادفی نرمال بریده شده، میتوان تابع چگالی احتمال را برای به صورت زیر نوشت:
البته مشخص است که میانگین توزیع نرمال و نیز انحراف استاندارد توزیع نرمال در نظر گرفته شده است. همچنین منظور از نیز تابع چگالی نرمال استاندارد و هم تابع توزیع تجمعی نرمال استاندارد است.
همانطور که دیده میشود، توزیع نرمال بریده شده دارای چهار پارامتر است که به ترتیب میانگین () و انحراف استاندارد () توزیع نرمال و همچنین کران پایین و کران بالای برای متغیر تصادفی است.
فرض کنید تبدیلات زیر را انجام دادهایم:
آنگاه میتوان تابع چگالی نرمال بریده شده را به صورت سادهتری که در ادامه قابل مشاهده است، نوشت.
نکته: درصورتی که باشد، مقدار تابع توزیع تجمعی نرمال استاندارد در نقطه برابر است با ۱. همچنین اگر میتوان نتیجه گرفت که . به این ترتیب خواهیم داشت:
بدیهی است که عبارت بالا همان تابع چگالی نرمال است. پس میتوان توزیع نرمال را حالت خاصی از توزیع نرمال بریده شده در نظر گرفت. منحنی تابع چگالی احتمال متغیر تصادفی نرمال بریده شده در تصویر زیر قابل مشاهده است. در این نمودار کرانها در نظر گرفته شدهاند. پارامترهای دیگر نیز برای خطوط سیاه رنگ به صورت ، برای خطوط آبی رنگ ، برای خطوط قرمز رنگ و برای خطوط زرد رنگ منظور شده است.
همچنین در تصویر زیر منحنی چگالی نرمال بریده شده از چپ قابل مشاهده است.
برای محاسبه تابع توزیع تجمعی متغیر تصادفی نرمال بریده شده، با توجه به تبدیلات گفته شده در بالا، میتوان از رابطه زیر استفاده کرد.
شکل تابع توزیع تجمعی نرمال بریده شده در تصویر زیر دیده میشود.
خصوصیات توزیع نرمال بریده شده
با توجه به ارتباطی که بین متغیر تصادفی نرمال و نرمال بریده شده وجود دارد، میتوان امید ریاضی، واریانس و دیگر مشخصات توزیع نرمال بریده شده را براساس توزیع نرمال، بازنویسی کرد.
امید ریاضی و واریانس توزیع نرمال بریده شده
از آنجایی که تابع چگالی احتمال متغیر تصادفی نرمال بریده شده با توجه به قیدی که برای مجموعه مقادیر وجود دارد، نوشته میشود، امید ریاضی این توزیع را میتوان به صورت زیر نوشت.
توجه داشته باشید که تعریفهای مربوط به ، و به همان شکلی است که در بالا توضیح داده شد. به همین ترتیب، میانه (Median) و نما (Mode) برای این توزیع به صورت زیر محاسبه میشوند.
برای محاسبه واریانس نیز از رابطه زیر میتوان کمک گرفت.
نکته: اگر توزیع نرمال بریده شده به صورت یک طرفه (بریده شده از راست یا چپ) باشد، برای محاسبه امید ریاضی و واریانس به صورت زیر عمل میکنیم.
امید ریاضی و واریانس نرمال بریده شده از چپ:
C
با توجه به اینکه است، در اینجا است.
امید ریاضی و واریانس نرمال بریده شده از راست:
شبیه سازی دادههای نرمال بریده شده
اگر مقدارهای متغیر تصادفی ، برطبق رابطه زیر محاسبه شوند، میتوان آن را یک متغیر تصادفی نرمال بریده شده در بازه در نظر گرفت.
در این رابطه منظور از تابع احتمال تجمعی توزیع نرمال استاندارد و نیز معکوس آن است. همچنین یک متغیر تصادفی یکنواخت پیوسته در بازه (0,1) است. بنابراین از این رابطه میتوان برای تولید دادههایی با توزیع نرمال بریده شده استفاده کرد. به این شیوه تولید اعداد تصادفی «روش تبدیل معکوس» (Inverse Transform Method) میگویند که قادر است از هر توزیعی (به شرطی معکوسپذیر بودن تابع توزیع تجمعی آن) اعداد تصادفی تولید کند. برای تولید چنین دادههایی در نرمافزارهای محاسباتی R و matlab کافی است از تابع استفاده کنید.
اگر به فراگیری مباحث مشابه مطلب بالا علاقهمند هستید، آموزشهایی که در ادامه آمدهاند نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- مجموعه آموزشهای SPSS
- مجموعه آموزشهای نرمافزارهای آماری
- آموزش آمار و احتمال مهندسی
- توزیع های آماری — مجموعه مقالات جامع وبلاگ فرادرس
^^