بوت استرپ (Bootstrapping) در SPSS — راهنمای کاربردی

۳۵۹۹ بازدید
آخرین به‌روزرسانی: ۷ خرداد ۱۴۰۲
زمان مطالعه: ۵ دقیقه
دانلود PDF مقاله
بوت استرپ (Bootstrapping) در SPSS — راهنمای کاربردی

به منظور برآورد انحراف استاندارد و فاصله اطمینان برای میانگین، میانه، نسبت و دیگر پارامترهای توزیع از روش «بوت‌ استرپ» استفاده می‌شود. البته این روش را برای برآورد خطای ضرایب رگرسیونی و همچنین انجام آزمون فرض نیز می‌توان به کار گرفت. در زمانی که اندازه نمونه کوچک و دقت برآوردگرها مطرح باشد، روش بوت استرپ، می‌تواند خطا را بوسیله روش باز‌نمونه‌گیری محاسبه کند و فاصله اطمینان یا انحراف استاندارد مناسب و پرتوانی، ارائه دهد.

997696

همچنین از این روش، زمانی که تابع توزیع احتمال برآوردگرها نامشخص یا پیچیده باشد، برای برآورد واریانس برآوردگرها بهره می‌برند. برای مثال پیدا کردن فاصله اطمینان برای میانه، چندک‌ها و ... به کمک روش بوت‌استرپ به راحتی صورت می‌پذیرد در حالیکه پیدا کردن توزیع احتمال برای این شاخص‌ها مشکل بوده و محاسبه واریانس و فاصله اطمینان برایشان به سادگی امکان‌پذیر نیست.

در این نوشتار به بررسی روش بوت استرپ و چگونگی استفاده از آن در SPSS می‌پردازیم. به منظور آشنایی بیشتر با روش بوت استرپ مطالعه نوشتار جک نایف و بوت استرپ (Jackknife and Bootstrap) روش های بازنمونه‌ گیری — به زبان ساده و نمونه‌ گیری و بازنمونه‌ گیری آماری (Sampling and Resampling) — به زبان ساده ضروری به نظر می‌رسد. همچنین خواندن مطلب تعیین حجم نمونه در تحلیل‌ های آماری — به زبان ساده و روش‌ های نمونه‌گیری (Sampling) در آمار — به زبان ساده نیز خالی از لطف نیست.

bootstrapping tech

بوت استرپ در SPSS

روش بوت استرپ از گروه روش‌های ناپارامتری و در بخش تکنیک‌های باز نمونه‌گیری قرار می‌گیرد. هدف از اجرای بوت استرپ، پیدا کردن خطای (واریانس) برآوردگر با استفاده از تکرار مراحل نمونه‌گیری و برآوردیابی است. در هر بار تکرار براساس یک عمل باز‌نمونه‌گیری از داده‌ها، برآوردگر مورد نظر محاسبه می‌شود. تکرار این مراحل مثلا به تعداد ۱۰۰ بار، منجر به تولید ۱۰۰ مقدار مختلف برای برآوردگر می‌شود.

میانگین این مقادیر، برای بدست آوردن امید ریاضی یا اریبی برآوردگر و واریانس یا انحراف معیار این مقدارها نیز می‌تواند برای پیدا کردن خطای برآوردگر به کار رود. در اینجا قصد داریم این روش را در SPSS مرور و به کار بگیریم. در نتیجه کار را با یک مثال در SPSS دنبال می‌کنیم. البته توجه داشته باشید که برای استفاده از این روش باید نسخه SPSS® Statistics Premium Edition را داشته یا بسته افزونه Bootstrapping را روی SPSS نصب کرده باشید.

استفاده از بوت استرپ در دستور Explore

با توجه به مقدمه‌ای که در مورد روش بوت استرپ گفته شد، در این قسمت به بررسی یک مثال به کمک داده‌های آموزشی SPSS می‌پردازیم. فایل Employee data.sav در پوشه samples مربوط به مشخصات کارمندان یک شرکت است. البته می‌توانید با کلیک روی اینجا این فایل را با قالب فشرده دریافت کنید. مدیریت شرکت احتیاج به بررسی تجربه کاری کارمندان در محل کار قبلی دارد. این متغیر کاملا به راست چوله است که باعث می‌شود، میانگین (Mean) برآوردگر خوبی برای شاخص تمرکز نباشد. بنابراین بهتر است از میانه (Median) برای نمایش نقطه تمرکز این متغیر استفاده شود. ولی متاسفانه برای میانه نمی‌توان به راحتی یک فاصله اطمینان به فرم بسته پیدا کرد. بنابراین از روش بوت استرپ برای پیدا کردن یک فاصله اطمینان برای میانه سابقه کار در این مثال استفاده می‌کنیم.

پس از باز کردن فایل اطلاعاتی Employee data.sav برای دسترسی به دستور Explorer مراحل زیر را طی کنید.

Analyze > Descriptive Statistics > Explore...

به این ترتیب پنجره مربوط به دستور Explorer باز می‌شود. تنظیمات این پنجره را مطابق با تصویر زیر انجام دهید.

explore dialog box

مشخص است که متغیر با نام prevexp و با برچسب (Previous Experience (months برای محاسبه میانه و فاصله اطمینان آن در کادر Dependent List قرار گرفته است. همچنین به انتخاب گزینه Statistics در کادر Display‌ دقت کنید. به این ترتیب فقط آماره‌ها محاسبه شده و نمودارها ترسیم نخواهند شد. برای اجرای روش بوت‌استرپ و محاسبه فاصله اطمینان، دکمه Bootstarp را انتخاب کنید. پنجره‌ای به مانند زیر ظاهر می‌شود. تنظیمات در تصویر دیده می‌شود. البته هر یک از این پارامترها را در ادامه توضیح خواهیم داد.

bootstrap_dialogbox

با انتخاب گزینه اول یعنی Perform bootstrapping از SPSS می‌خواهید که خطای برآوردگرها را به کمک این روش محاسبه کند. در کادر Number of samples تعداد نمونه‌ها را مشخص می‌کنید. هر چه تعداد نمونه‌های بیشتری را عمل باز‌نمونه‌گیری معرفی کنید، دقت برآوردگرها بیشتر خواهد شد. البته این کار منجر به افزایش زمان محاسبات نیز خواهد شد. از آنجایی که انتخاب نمونه‌ها به صورت تصادفی صورت می‌گیرد، با تکرار دستور Explorer، نمونه‌ها و میزان خطای محاسبه شده متفاوت خواهند بود. ولی با انتخاب یک seed برای تولید اعداد تصادفی مربوط به انتخاب نمونه‌ها، می‌توانید نتایج یکسانی از تکرار این دستور داشته باشید. البته انجام این کار ضرورتی ندارد ولی با این کار و اجرای دستورات، نتایجی درست به مانند نتایجی که ما در این نوشتار بدست آورده‌ایم، حاصل خواهد شد. به این منظور در کادر Seed مقدار 592004 را وارد کنید تا همیشه همین نتایج را بدست آوریم.

در کادر «فاصله اطمینان» (Confidence Intervals) نیز امکان تعریف خصوصیات فاصله اطمینان را دارید. مقدار سطح اطمینان را در قسمت (%)Level بین ۵۰ تا ۱۰۰ وارد کنید. اگر می‌خواهید یک فاصله اطمینان ۹۵٪ برای میانه ایجاد کنید، مقدار ۹۵ را در این کادر بنویسید. برای ایجاد این فاصله اطمینان دو روش در این پنجره معرفی شده‌اند. روش ابتدایی و ساده‌تر، استفاده از چندک‌ها یا همان صدک‌های میانه‌های حاصل از باز‌نمونه‌گیری‌ها است. روش دوم استفاده از تکنیک BCa یا (Bias Correction and acceleration) است که البته زمان و بار محاسباتی بیشتری دارد ولی در عوض دارای دقت بیشتری نیز هست زیرا اریبی را کاهش می‌دهد. بنابراین در اینجا از این راهکار استفاده کرده‌ایم.

در قسمت انتهایی یعنی Sampling می‌توانید روش نمونه‌گیری را به صورت یکی از حالت‌های نمونه‌گیری ساده تصادفی (Simple) یا نمونه‌گیری طبقه‌ای (Stratified) انتخاب کنید. در نمونه‌گیری طبقه‌ای باید متغیری که باعث ایجاد طبقات می‌شود را در کادر strata variables قرار دهید. با فشردن دکمه Continue به پنجره قبلی بازگشته و با انتخاب دکمه Ok خروجی را در پنجره output‌ مشاهده خواهید کرد.

همانطور که در خروجی شاهد هستید، برای متغیر prevexp شاخص‌های آماری به همراه یک فاصله اطمینان ۹۵٪ حاصل از روش بوت استرپ دیده می‌شود. برای میانه نیز این فاصله به صورت (60.00،50.0060.00،50.00) ظاهر شده است. همچنین خطا و اریبی (Bias) برآورد میانه نیز محاسبه و نمایش داده شده است. توجه داشته باشید که این سابقه برحسب ماه در نظر گرفته شده است.

همانطور که می‌دانید براساس انحراف استاندارد داده‌ها، می‌توان انحراف استاندارد میانگین (Std. Error) را محاسبه کرد. به این ترتیب خطای برآورد میانگین برابر با انحراف استاندارد داده‌ها تقسیم بر جذر تعداد نمونه‌ها است. همانطور که دیده می‌شود مقدار انحراف استاندارد میانگین یا همان خطای برآوردگر میانگین (4.804) که در ستون سوم جدول زیر دیده می‌شود با میزان برآورد خطای میانگین با روش بوت استرپ (مقدار ستون پنجم 4.86) تقریبا برابر است. ولی این کار برای میانه به سادگی صورت نمی‌گیرد. به همین منظور از برآورد بوت استرپ برای محاسبه خطا و فاصله اطمینان برای میانه استفاده کردیم.

output_bootstrap_explore

با استفاده از جدول بالا کاملا مشخص است که مقدار میانه «سابقه کار قبلی» برابر با 55.00 ماه با خطای 3.66 ماه و میزان اریبی 0.11- ماه برآورد شده است، زیرا ارقام مربوط به سابقه کار برحسب ماه بیان شده بودند. البته می‌توان مشاهده کرد که برای دیگر ویژگی‌های این متغیر مانند واریانس و چولگی و کشیدگی محاسبات مربوط به فاصله اطمینان و اریبی و خطای برآورد توسط روش بوت استرپ انجام و نمایش داده شده است.

اگر به فراگیری مباحث مشابه مطلب بالا علاقه‌مند هستید، آموزش‌هایی که در ادامه آمده‌اند نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
۶ دیدگاه برای «بوت استرپ (Bootstrapping) در SPSS — راهنمای کاربردی»

سلام وقت بخیر. در مورد بوت استراپینگ سؤالی دارم. اینکه زمانی نمونه کمتر از 100 هست بایستی از این روش استفاده کرد. برای مثال در زمان همبستگی بین دو متغیر وقتی از بوت استراپینگ استفاده می شود خروجی داده ها تفاوتی ندارد. ممنون می شوم در این رابطه راهنمایی بفرمایید.


با سلام و احترام؛

این احتمال وجود دارد که با افزایش تعداد تکرارها مشکلی که عنوان شد برطرف شود.

از همراهی شما با مجله فرادرس سپاس‌گزاریم

سلام برای برآورد bias تک تک داده ها چیکار باید بکنیم
چون در روش گفته شده در spss تنها bias میانگین داده ها رو محاسبه می کنه

سلام و درود به شما همراه مجله فرادرس!
همانطور که در متن خواندید، هدف از محاسبه bias نمایش انحراف برآوردگر از پارامتر جامعه است. از آنجایی که میانگین را به عنوان یک برآوردگر نقطه‌ای در نظر گرفته‌ایم، اریبی یا Bias را برای آن محاسبه کرده‌ایم. اگر یک مشاهده را به عنوان برآوردگر در نظر بگیرید، فاصله آن از پارامتر به عنوان اریبی محسوب می‌شود. از آنجایی که این داده از یک نمونه به نمونه دیگر متفاوت است، چند بار نمونه‌گیری کرده و میانگین مقادیر را به عنوان برآوردگر در نظر می‌گیریم سپس اریبی را محاسبه می‌کنیم.
پیروز و تندرست باشید.

پوشه sample کجاست؟ ما چه جوری می تونیم employee data.sav رو داشته باشیم؟

درود بر شما همراه مجله فرادرس.
لینک مربوط به فایل employee data در نوشتار (بوت استرپ در SPSS) گذاشته شد. می‌توانید این پرونده را دریافت و استفاده کنید.

با سپاس فراوان برای توجه شما به نوشتارهای فرادرس، بدرود.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *