بوت استرپ (Bootstrapping) در SPSS — راهنمای کاربردی
به منظور برآورد انحراف استاندارد و فاصله اطمینان برای میانگین، میانه، نسبت و دیگر پارامترهای توزیع از روش «بوت استرپ» استفاده میشود. البته این روش را برای برآورد خطای ضرایب رگرسیونی و همچنین انجام آزمون فرض نیز میتوان به کار گرفت. در زمانی که اندازه نمونه کوچک و دقت برآوردگرها مطرح باشد، روش بوت استرپ، میتواند خطا را بوسیله روش بازنمونهگیری محاسبه کند و فاصله اطمینان یا انحراف استاندارد مناسب و پرتوانی، ارائه دهد.
همچنین از این روش، زمانی که تابع توزیع احتمال برآوردگرها نامشخص یا پیچیده باشد، برای برآورد واریانس برآوردگرها بهره میبرند. برای مثال پیدا کردن فاصله اطمینان برای میانه، چندکها و ... به کمک روش بوتاسترپ به راحتی صورت میپذیرد در حالیکه پیدا کردن توزیع احتمال برای این شاخصها مشکل بوده و محاسبه واریانس و فاصله اطمینان برایشان به سادگی امکانپذیر نیست.
در این نوشتار به بررسی روش بوت استرپ و چگونگی استفاده از آن در SPSS میپردازیم. به منظور آشنایی بیشتر با روش بوت استرپ مطالعه نوشتار جک نایف و بوت استرپ (Jackknife and Bootstrap) روش های بازنمونه گیری — به زبان ساده و نمونه گیری و بازنمونه گیری آماری (Sampling and Resampling) — به زبان ساده ضروری به نظر میرسد. همچنین خواندن مطلب تعیین حجم نمونه در تحلیل های آماری — به زبان ساده و روش های نمونهگیری (Sampling) در آمار — به زبان ساده نیز خالی از لطف نیست.
بوت استرپ در SPSS
روش بوت استرپ از گروه روشهای ناپارامتری و در بخش تکنیکهای باز نمونهگیری قرار میگیرد. هدف از اجرای بوت استرپ، پیدا کردن خطای (واریانس) برآوردگر با استفاده از تکرار مراحل نمونهگیری و برآوردیابی است. در هر بار تکرار براساس یک عمل بازنمونهگیری از دادهها، برآوردگر مورد نظر محاسبه میشود. تکرار این مراحل مثلا به تعداد ۱۰۰ بار، منجر به تولید ۱۰۰ مقدار مختلف برای برآوردگر میشود.
میانگین این مقادیر، برای بدست آوردن امید ریاضی یا اریبی برآوردگر و واریانس یا انحراف معیار این مقدارها نیز میتواند برای پیدا کردن خطای برآوردگر به کار رود. در اینجا قصد داریم این روش را در SPSS مرور و به کار بگیریم. در نتیجه کار را با یک مثال در SPSS دنبال میکنیم. البته توجه داشته باشید که برای استفاده از این روش باید نسخه SPSS® Statistics Premium Edition را داشته یا بسته افزونه Bootstrapping را روی SPSS نصب کرده باشید.
استفاده از بوت استرپ در دستور Explore
با توجه به مقدمهای که در مورد روش بوت استرپ گفته شد، در این قسمت به بررسی یک مثال به کمک دادههای آموزشی SPSS میپردازیم. فایل Employee data.sav در پوشه samples مربوط به مشخصات کارمندان یک شرکت است. البته میتوانید با کلیک روی اینجا این فایل را با قالب فشرده دریافت کنید. مدیریت شرکت احتیاج به بررسی تجربه کاری کارمندان در محل کار قبلی دارد. این متغیر کاملا به راست چوله است که باعث میشود، میانگین (Mean) برآوردگر خوبی برای شاخص تمرکز نباشد. بنابراین بهتر است از میانه (Median) برای نمایش نقطه تمرکز این متغیر استفاده شود. ولی متاسفانه برای میانه نمیتوان به راحتی یک فاصله اطمینان به فرم بسته پیدا کرد. بنابراین از روش بوت استرپ برای پیدا کردن یک فاصله اطمینان برای میانه سابقه کار در این مثال استفاده میکنیم.
پس از باز کردن فایل اطلاعاتی Employee data.sav برای دسترسی به دستور Explorer مراحل زیر را طی کنید.
Analyze > Descriptive Statistics > Explore...
به این ترتیب پنجره مربوط به دستور Explorer باز میشود. تنظیمات این پنجره را مطابق با تصویر زیر انجام دهید.
مشخص است که متغیر با نام prevexp و با برچسب (Previous Experience (months برای محاسبه میانه و فاصله اطمینان آن در کادر Dependent List قرار گرفته است. همچنین به انتخاب گزینه Statistics در کادر Display دقت کنید. به این ترتیب فقط آمارهها محاسبه شده و نمودارها ترسیم نخواهند شد. برای اجرای روش بوتاسترپ و محاسبه فاصله اطمینان، دکمه Bootstarp را انتخاب کنید. پنجرهای به مانند زیر ظاهر میشود. تنظیمات در تصویر دیده میشود. البته هر یک از این پارامترها را در ادامه توضیح خواهیم داد.
با انتخاب گزینه اول یعنی Perform bootstrapping از SPSS میخواهید که خطای برآوردگرها را به کمک این روش محاسبه کند. در کادر Number of samples تعداد نمونهها را مشخص میکنید. هر چه تعداد نمونههای بیشتری را عمل بازنمونهگیری معرفی کنید، دقت برآوردگرها بیشتر خواهد شد. البته این کار منجر به افزایش زمان محاسبات نیز خواهد شد. از آنجایی که انتخاب نمونهها به صورت تصادفی صورت میگیرد، با تکرار دستور Explorer، نمونهها و میزان خطای محاسبه شده متفاوت خواهند بود. ولی با انتخاب یک seed برای تولید اعداد تصادفی مربوط به انتخاب نمونهها، میتوانید نتایج یکسانی از تکرار این دستور داشته باشید. البته انجام این کار ضرورتی ندارد ولی با این کار و اجرای دستورات، نتایجی درست به مانند نتایجی که ما در این نوشتار بدست آوردهایم، حاصل خواهد شد. به این منظور در کادر Seed مقدار 592004 را وارد کنید تا همیشه همین نتایج را بدست آوریم.
در کادر «فاصله اطمینان» (Confidence Intervals) نیز امکان تعریف خصوصیات فاصله اطمینان را دارید. مقدار سطح اطمینان را در قسمت (%)Level بین ۵۰ تا ۱۰۰ وارد کنید. اگر میخواهید یک فاصله اطمینان ۹۵٪ برای میانه ایجاد کنید، مقدار ۹۵ را در این کادر بنویسید. برای ایجاد این فاصله اطمینان دو روش در این پنجره معرفی شدهاند. روش ابتدایی و سادهتر، استفاده از چندکها یا همان صدکهای میانههای حاصل از بازنمونهگیریها است. روش دوم استفاده از تکنیک BCa یا (Bias Correction and acceleration) است که البته زمان و بار محاسباتی بیشتری دارد ولی در عوض دارای دقت بیشتری نیز هست زیرا اریبی را کاهش میدهد. بنابراین در اینجا از این راهکار استفاده کردهایم.
در قسمت انتهایی یعنی Sampling میتوانید روش نمونهگیری را به صورت یکی از حالتهای نمونهگیری ساده تصادفی (Simple) یا نمونهگیری طبقهای (Stratified) انتخاب کنید. در نمونهگیری طبقهای باید متغیری که باعث ایجاد طبقات میشود را در کادر strata variables قرار دهید. با فشردن دکمه Continue به پنجره قبلی بازگشته و با انتخاب دکمه Ok خروجی را در پنجره output مشاهده خواهید کرد.
همانطور که در خروجی شاهد هستید، برای متغیر prevexp شاخصهای آماری به همراه یک فاصله اطمینان ۹۵٪ حاصل از روش بوت استرپ دیده میشود. برای میانه نیز این فاصله به صورت () ظاهر شده است. همچنین خطا و اریبی (Bias) برآورد میانه نیز محاسبه و نمایش داده شده است. توجه داشته باشید که این سابقه برحسب ماه در نظر گرفته شده است.
همانطور که میدانید براساس انحراف استاندارد دادهها، میتوان انحراف استاندارد میانگین (Std. Error) را محاسبه کرد. به این ترتیب خطای برآورد میانگین برابر با انحراف استاندارد دادهها تقسیم بر جذر تعداد نمونهها است. همانطور که دیده میشود مقدار انحراف استاندارد میانگین یا همان خطای برآوردگر میانگین (4.804) که در ستون سوم جدول زیر دیده میشود با میزان برآورد خطای میانگین با روش بوت استرپ (مقدار ستون پنجم 4.86) تقریبا برابر است. ولی این کار برای میانه به سادگی صورت نمیگیرد. به همین منظور از برآورد بوت استرپ برای محاسبه خطا و فاصله اطمینان برای میانه استفاده کردیم.
با استفاده از جدول بالا کاملا مشخص است که مقدار میانه «سابقه کار قبلی» برابر با 55.00 ماه با خطای 3.66 ماه و میزان اریبی 0.11- ماه برآورد شده است، زیرا ارقام مربوط به سابقه کار برحسب ماه بیان شده بودند. البته میتوان مشاهده کرد که برای دیگر ویژگیهای این متغیر مانند واریانس و چولگی و کشیدگی محاسبات مربوط به فاصله اطمینان و اریبی و خطای برآورد توسط روش بوت استرپ انجام و نمایش داده شده است.
اگر به فراگیری مباحث مشابه مطلب بالا علاقهمند هستید، آموزشهایی که در ادامه آمدهاند نیز به شما پیشنهاد میشوند:
- مجموعه آموزش های SPSS
- مجموعه آموزش های Minitab
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- فاصله اطمینان (Confidence Interval) — به زبان ساده
- آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات
- آزمون فرض میانگین جامعه در آمار — به زبان ساده
^^
سلام وقت بخیر. در مورد بوت استراپینگ سؤالی دارم. اینکه زمانی نمونه کمتر از 100 هست بایستی از این روش استفاده کرد. برای مثال در زمان همبستگی بین دو متغیر وقتی از بوت استراپینگ استفاده می شود خروجی داده ها تفاوتی ندارد. ممنون می شوم در این رابطه راهنمایی بفرمایید.
با سلام و احترام؛
این احتمال وجود دارد که با افزایش تعداد تکرارها مشکلی که عنوان شد برطرف شود.
از همراهی شما با مجله فرادرس سپاسگزاریم
سلام برای برآورد bias تک تک داده ها چیکار باید بکنیم
چون در روش گفته شده در spss تنها bias میانگین داده ها رو محاسبه می کنه
سلام و درود به شما همراه مجله فرادرس!
همانطور که در متن خواندید، هدف از محاسبه bias نمایش انحراف برآوردگر از پارامتر جامعه است. از آنجایی که میانگین را به عنوان یک برآوردگر نقطهای در نظر گرفتهایم، اریبی یا Bias را برای آن محاسبه کردهایم. اگر یک مشاهده را به عنوان برآوردگر در نظر بگیرید، فاصله آن از پارامتر به عنوان اریبی محسوب میشود. از آنجایی که این داده از یک نمونه به نمونه دیگر متفاوت است، چند بار نمونهگیری کرده و میانگین مقادیر را به عنوان برآوردگر در نظر میگیریم سپس اریبی را محاسبه میکنیم.
پیروز و تندرست باشید.
پوشه sample کجاست؟ ما چه جوری می تونیم employee data.sav رو داشته باشیم؟
درود بر شما همراه مجله فرادرس.
لینک مربوط به فایل employee data در نوشتار (بوت استرپ در SPSS) گذاشته شد. میتوانید این پرونده را دریافت و استفاده کنید.
با سپاس فراوان برای توجه شما به نوشتارهای فرادرس، بدرود.