متغیر تصادفی و توزیع فوق هندسی (Hyper Geometric) – به زبان ساده


در آزمایش برنولی هر عضو از جامعه آماری یا دارای یک ویژگی (موفقیت) و یا فاقد آن (شکست) است. بر این اساس میتوان آزمایش تصادفی جدیدی معرفی کرد که نشان دهنده تعداد موفقیتها در یک طرح نمونهگیری بدون جایگذاری باشد. از طرفی میدانیم، در این حالت اگر نمونهگیری با جایگذاری باشد یا اندازه جامعه آماری بزرگ انتخاب شود، یک آزمایش دو جملهای انجام شده است. برای آشنایی بیشتر با مفهوم آزمایش تصادفی و آزمایش برنولی میتوانید به نوشتار متغیر تصادفی و توزیع برنولی --- به زبان ساده و برای متغیر تصادفی دو جملهای به مطلب متغیر تصادفی و توزیع دو جملهای — به زبان ساده مراجعه کنید.
ولی در این حالت اگر عمل نمونهگیری، بدون جایگذاری در نظر گرفته شود، آزمایش تصادفی جدیدی با نام «فوق هندسی» (Hyper Geometric) ایجاد میشود.
متغیر تصادفی فوق هندسی
در یک مجموعه N تایی، M عضو دارای ویژگی خاصی هستند. اگر از این مجموعه یک نمونه nتایی بدون جایگذاری تهیه شود یک متغیر تصادفی گسسته به نام متغیر تصادفی فوق هندسی با پارامترهای M، N و n داریم.
اگر این متغیر تصادفی را با X نشان دهیم در این حالت مینویسیم و میخوانیم X دارای توزیع فوق هندسی با پارامترهای و n است.
با توجه به تعریف گفته شده برای تکیهگاه این متغیر تصادفی، مشخص است که حداکثر مقدار x یا n خواهد بود (به این معنی که همه اعضای نمونه دارای ویژگی خاص باشند) و یا مقداری کمتر از M خواهد بود. همچنین حداقل مقدار برای x در حالتی که هیچ عضوی در نمونه، ویژگی خاص ندارد صفر است. واضح است n-x نیز باید بین صفر و N-M باشد پس n در نتیجه . به این ترتیب حداقل مقدار برای x برابر است با .
اگر تابع احتمال این متغیر تصادفی را برای مقدارهای مختلف n و M و همچنین x رسم کنیم نموداری به شکل زیر ایجاد میشود:
مثال ۱
از بین ۷ کارمند و ۴ سرپرست، یک کمیته سه نفری به تصادف انتخاب میشود. احتمال اینکه همه اعضا کارمند باشند چقدر است؟ احتمال اینکه همه اعضای کمیته سرپرست باشند چقدر است؟ احتمال اینکه سرپرستها در اقلیت باشند چقدر است؟
با توجه به تابع احتمال معرفی شده برای توزیع فوق هندسی مشخص است که اگر X را تعداد کارمندان در کمیته در نظر بگیریم میتوانیم بنویسیم . در نتیجه محاسبات برای قسمت اول سوال به صورت زیر است:
همچنین برای قسمت دوم سوال نیز میتوانیم به صورت زیر عمل کنیم:
با توجه به مفهوم اقلیت در قسمت سوم سوال کافی است احتمال زیر را محاسبه کنیم:
اگر p درصد افرادی از جامعه با حجم N باشند که دارای ویژگی خاصی هستند، میتوان متغیر تصادفی فوق هندسی را با پارامترهای N و Np و n معرفی کرد و نوشت . واضح است که در این حالت M=Np در نظر گرفته شده است.
نکته: اگر N به اندازه کافی بزرگ باشد، میتوان از توزیع دو جملهای به منظور محاسبه تقریبی احتمال برای متغیر تصادفی فوق هندسی کمک گرفت.
مثال ۲
در هر کارتن بیسکویت، تعداد ۵۰ بسته وجود دارد و احتمال اینکه بستهای در کارتن خرد شده باشد ۱۰٪ است. حال احتمال اینکه در یک نمونه ۵تایی از یک کارتن بیش از ۱ بسته خرد شده باشد چقدر است؟
مشخص است که X، یعنی تعداد بستههای خرد شده، دارای توزیع فوق هندسی است. با توجه به اینکه در کارتن ۵۰ تایی تعداد بستههای خراب برابر است با میتوانیم بنویسیم .
در نتیجه مقدار احتمال اینکه بیش از ۱ بسته در کارتن خراب باشد برابر خواهد بود با:
حال اگر از تقریب دو جملهای استفاده کنیم میتوانیم بنوسیم پس خواهیم داشت:
که حدود 0.01 اختلاف دارند.
امید-ریاضی و واریانس برای توزیع فوق هندسی
با توجه به تعریف امید-ریاضی و واریانس میتوان برای توزیع فوق هندسی این آمارهها را محاسبه کرد. اگر باشد، خواهیم داشت:
کابردهای متغیر تصادفی فوق هندسی
در ادامه با دو مثال به بررسی کاربردهای متغیر تصادفی فوق هندسی میپردازیم.
مثال ۳
یکی از کاربردهای اصلی برای متغیر تصادفی با توزیع فوق هندسی نمونه گیری بدون جایگذاری است. یک آزمایش تصادفی را در نظر بگیرید که در آن باید n توپ از یک جعبه انتخاب شود. درون این جعبه N توپ وجود دارد که M توپ آن به رنگ سیاه است (واضح است که N-M توپ نیز به رنگ قرمز هستند). فرض کنید که انتخاب توپ سیاه از درون جعبه موفقیت محسوب شود و انتخاب توپ قرمز شکست (درست به مانند آزمایش تصادفی دو جملهای یا برنولی). تعداد موفقیتها یعنی X در این آزمایش تصادفی یک متغیر تصادفی فوق هندسی است که مقدار آن را با x نشان میدهیم. به جدول زیر توجه کنید:
انتخاب شده | انتخاب نشده | تعداد کل توپها | |
توپ سیاه | x=4 | M-x=1 | M=5 |
توپ قرمز | n-x | N-M=45 | |
تعداد کل انتخابها | n=10 | N-n=40 | N=50 |
حال فرض کنید برای مثال تعداد توپهای سیاه برابر با ۵ و تعداد توپهای قرمز برابر با ۴۵ باشد. به طور تصادفی از جعبه (بدون نگاه کردن به درون آن) ۱۰ توپ به نوبت انتخاب کرده و روی میز چیدهایم (انتخاب بدون جایگذاری). احتمال اینکه دقیقا ۴ توپ از ۱۰ تا سیاه باشند چقدر است؟ این اطلاعات در جدول بالا مشخص شده است. پس میتوان نوشت . حال برای محاسبه احتمال کافی است محاسبات را به صورت زیر انجام دهیم:
این طور به نظر میرسد که انتظار نداریم همه توپهای سیاه در انتخاب ما حضور داشته باشند، زیرا تعداد توپهای قرمز به نسبت توپهای سیاه بیشتر هستند.
مثال ۴
یکی دیگر از کابردهای متغیر تصادفی فوق هندسی، پیدا کردن احتمال رد یک محموله حین بازرسی نمونهای در کنترل کیفیت آماری است. همچنین به کمک احتمال مربوط به متغیر تصادفی فوق هندسی، میتوان برآوردی برای تعداد ورود کالاهای معیوب به بازار را بدست آورد. بازرسان کیفیت معمولا ۱٪ تا ۱۰٪ محمولههای کالا را مورد بررسی قرار میدهند. شاید بتوان گفت که به طور متوسط این مقدار برابر با ۳٪ است. بنابراین شانس نفوذ یک محموله خراب به بازار زیاد است.
زیرا اگر فرض کنیم ۵٪ محمولههای انبار مشکل دارند (یعنی 5 تا از ۱۰۰ محموله) ، با بررسی ۳٪ از محمولهها شانس اینکه با هیچ محموله معیوبی مواجه نشویم برابر است با ۸۶٪ و احتمال اینکه محموله معیوب شناسایی شود برابر با 14٪=86٪-۱ خواهد بود.
این احتمالات توسط تابع احتمال متغیر تصادفی فوق هندسی محاسبه شدهاند. در اینجا تعداد انتخاب محمولههای معیوب در نظر گرفته شده است.
در چنین وضعیتی حجم نمونه برای رسیدن به حداقل یک محموله معیوب در بازرسی برابر با ۴۵ محموله خواهد بود که نشان میدهد باید ۴۵ محموله از ۱۰۰ تا بررسی شود تا احتمال رسیدن به حداقل یک محموله خراب برابر با 96.4٪ باشد. زیرا:
در نتیجه که نشان میدهد با احتمال زیاد با یک محموله معیوب برخورد خواهیم کرد.
اگر مطلب بالا برای شما مفید بوده است، احتمالاً آموزشهایی که در ادامه آمدهاند نیز برایتان کاربردی خواهند بود.
- مجموعه آموزش های برنامه نویسی متلب برای علوم و مهندسی
- متغیر های تصادفی – میانگین، واریانس و انحراف معیار – به زبان ساده
- آموزش آمار و احتمال مهندسی
- متغیر تصادفی و توزیع برنولی --- به زبان ساده
- متغیر تصادفی و توزیع دو جملهای — به زبان ساده
^^
درسنامه تون خوب بود ولی از مثال ۴ به بعد فکر میکنم یکم پیچیده توضیح دادید
با سلام و خسته نباشید .
واقعا ممنونم از سایت فوق العادتون .
عالییییییی