مفاهیم آماری – روشهای استنباطی


زمانی که از خصوصیات نمونه جمعآوری شده، سعی در شناخت پارامتر جامعه آماری داریم، دست به استنباط آماری میزنیم. در این شیوه علمی از جزء به کل خواهیم رسید. البته این کار همیشه مطمئن نیست. بنابراین در انجام استنباط آماری همیشه حداکثر خطای ممکن را بیان خواهیم کرد.
استنباط پارامتری
اگر در مراحل تحلیل آماری، که هدف رسیدن از خصوصیات نمونه، به خصوصیات جامعه آماری است؛ از توزیع و الگوی احتمالی جامعه آماری استفاده کردهباشیم، استنباط را استنباط پارامتری گویند.
از توزیعهای مهم در تحلیلهای آماری، توزیع نرمال و توزیع دوجملهای است که هر دو در تجزیه و تحلیل پدیدههای شانسی (که روش نمونهگیری بر آن استوار است) نقش بسزایی دارند. اگر بدانیم توزیع جامعه آماری به چه شکلی است، روشهای متعددی برای بررسی و تجزیه و تحلیل و رسیدن از آماره به پارامتر جامعه آماری وجود دارد که به مجموعهی این روشها، استنباط پارامتری گویند.
در حالت ایدهآل توزیع جامعه آماری را نرمال در نظر میگیریم.
استنباط ناپارامتری
اگر در بررسی و تجزیه و تحلیل آماری؛ توزیع جامعه آماری در نظر گرفته نشود، اطلاعات کمتری از جامعه آماری وجود دارد و روشها دشوارتر و میزان اطمینان به آنها کمتر است. در نتیجه ممکن است اندازهی نمونه مورد احتیاج برای رسیدن به استنباط مناسب بزرگتر از روشهای استنباط پارامتری باشد.
مجموعه روشهایی که در آن توزیع جامعه آماری لحاظ نشده باشد و یا مشخص نباشد؛ روشهای استنباط ناپارامتری گفته میشود.
مدل سازی
اگر به کمک دادههای جمعآوری شده از چندین متغیر مرتبط با یک پدیده تصادفی، قادر به کشف رابطه بین این متغیرها شویم یک مدل آماری ایجاد کردهایم. از آنجایی که متغیرها دارای مقادیری براساس الگوی احتمالی هستند، این مدل را مدل احتمالی نیز مینامند.
همانطور که دیده میشود، مدل سازی بر اساس دادههای تصادفی با مدل سازی ریاضی متفاوت است. در مدل سازی آماری، برمبنای کار احتمال و الگوی احتمالی مقادیر جمعآوری شده است در حالیکه مدلسازی ریاضی براساس واقعیات و فرضیاتی است که از پدیده مورد نظر در اختیارمان است.
امروزه مدل سازی آماری در زمینههای دادهکاوی به کار گرفته شده تا قادر به استخراج دانش و تشکیل الگوهای رفتاری در پدیدههای احتمالی با حجم زیاد شویم.