آمار, داده کاوی 152 بازدید

آزمون واریانس یک طرفه (One-way ANOVA) یکی از محبوب‌ترین آزمون‌های آماری است که به مقایسه و بررسی میانگین بین سه یا چند جامعه می‌پردازد. البته برای استفاده از این آزمون یا تحلیل، شرایطی نیز وجود دارد که قبل از اجرای آن باید مورد بررسی قرار گیرند. در این نوشتار از مجله فرادرس به نحوه انجام آنالیز واریانس یک طرفه در اکسل خواهیم پرداخت و با ذکر مثالی، خروجی‌های حاصل در اکسل را مشاهده و نتیجه آزمون را مشخص خواهیم کرد.

بهتر است قبل از خواندن این مطلب با اصطلاحاتی مانند «جدول آنالیز واریانس» (ANOVA) یا «آنالیز واریانس یک طرفه» (One-way ANOVA) آشنا باشید. همچنین خواندن نوشتار آزمون فرض میانگین جامعه در آمار — به زبان ساده و آموزش اکسل — به زبان ساده نیز خالی از لطف نیست.

آنالیز واریانس یک طرفه در اکسل

از مطالب دیگر مجله فرادرس در زمینه تحلیل یا آنالیز واریانس، فرا گرفتید که جدول تحلیل واریانس برای مقایسه میانگین در بین سه گروه یا بیشتر مورد استفاده قرار می‌گیرد. فرض کنید سه جامعه مستقل از یکدیگر (دانش آموزان مقطع پیش‌دبستان، دبستان و دبیرستان) دارید که برایشان یک ویژگی (مثلا وزن) را اندازه‌گیری کرده‌اید. به کمک تحلیل واریانس می‌توانیم نشان دهیم که وزن این سه گروه، با یکدیگر اختلاف داشته و این تفاوت‌ها، از لحاظ آماری نیز معنی‌دار است. البته توجه داشته باشید که ممکن است توسط تحلیل واریانس به این نتیجه برسیم که هر سه گروه یکسان هستند و میانگین در بین این سه جامعه تفاوت یا  اختلاف آماری ندارند.

نکته: منظور از اختلاف آماری، با اختلاف ریاضی متفاوت است. از آنجایی که با استفاده از نمونه آماری دست به استنباط زده‌ایم، ممکن است اختلاف در میانگین نمونه‌ها ناشی از خطای نمونه‌گیری بوده و واقعا جوامع با هم تفاوت نداشته باشند. این مفهوم نشانگر عدم اختلاف آماری بین میانگین جوامع است در حالیکه از لحاظ ریاضی میانگین نمونه‌ها، با یکدیگر متفاوت هستند.

به این ترتیب، آنالیز واریانس یک تکنیک برای اجرای آزمون فرض آماری محسوب می‌شود که اجازه انجام آزمون همزمان روی میانگین برای بیش از سه جامعه یا گروه را به محقق یا تحلیل‌گر آماری، می‌دهد. توجه دارید که در آزمون فرض آماری، ابتدا نمونه‌هایی جمع آوری شده، سپس براساس مقادیر آن‌ها در سه گروه مختلف، می‌توانیم نسبت به رد یا تایید فرضیه آماری تصمیم بگیریم. فرضیه‌های آماری احکامی هستند که برای جامعه آماری صادر می‌شود. به این معنی که به واسطه مقادیر جمع‌آوری شده از نمونه و به کارگیری محاسبات و قوانین مربوط به آزمون فرض، در مورد جامعه آماری به یک نتیجه‌گیری می‌رسیم.

توجه داشته باشید که در آنالیز واریانس یک طرفه (One-way ANOVA)، دسته یا گروه‌ها، به کمک یک متغیر طبقه‌ای تولید می‌شوند. در حقیقت گروه‌ها، سطوح مختلف مقادیر متغیر طبقه‌ای هستند.

نکته: ممکن است تحلیل واریانس براساس دو متغیر طبقه‌ای یا بیشتر صورت گیرد، در این صورت تحلیل واریانس را «دو طرفه» (Two-way ANOVA) یا «چند طرفه» (Multi-way ANOVA) می‌نامند. ولی به علت ایجاد حالت‌های متعدد برای مقایسه و تحلیل، معمولا از تحلیل واریانس یک یا دو طرفه استفاده می‌شود.

در آنالیز واریانس یک طرفه، فرضیه‌های آماری به صورت زیر نوشته می‌شوند.

  • فرض صفر: میانگین همه گروه‌ها برابر هستند.
  • فرض مقابل: همه میانگین‌ها در بین گروه‌ها، یکسان نیستند.

پس می‌توانیم فرض‌های را به صورت زیر نشان دهیم. البته تعداد جوامع برای مقایسه را $$k$$ در نظر گرفته‌ایم.

$$ \large H_0 : \mu_1 = \mu_2 = \ldots = \mu_k $$

$$ \large H_1 : \text{ There are some } \mu_i \text{ which is not equal with others}$$

مقدار احتمال (p-value)، به عنوان خروجی اغلب نرم‌افزارهای محاسباتی برای آزمون‌های آماری، ظاهر می‌شود و با «سطح معنی داری» (Significance Level) مقایسه می‌شود. اگر مقدار احتمال از مقدار خطای نوع اول (سطح معنی‌داری) در نظر گرفته شده برای آزمون، کوچکتر باشد، فرض صفر رد می‌شود و به نظر می‌رسد که میانگین حداقل یکی از گروه‌ها، با بقیه تفاوت دارد. ولی اگر p-value بزرگتر از خطای نوع اول (یا سطح آزمون – $$\alpha$$) باشد، دلیلی بر رد فرض صفر وجود ندارد و می‌توان گفت که نمونه حاصل، تاییدی بر فرض صفر است. توجه داشته باشید که اغلب ۰٫۰۵ در نظر گرفته می‌شود. ولی در کارهای مرتبط به پزشکی و حساس، مقدار سطح آزمون را ۰٫۰۱ فرض می‌کنند.

در ادامه هنگام اجرای تحلیل یا آنالیز واریانس یک طرفه در اکسل مقدار p-value را مشاهده خواهیم کرد.

برای اجرای تحلیل یا آنالیز واریانس یک طرفه در اکسل می‌توان فرمول‌ها و محاسبات را در سلول‌ها پیاده‌سازی کرده و یک جدول تحلیل واریانس ایجاد کرد. ولی خوشبختانه یک افزونه به نام Data Analysis قادر به انجام آزمون تحلیل واریانس یک طرفه و ایجاد جدول مربوطه است. به همین علت در این نوشتار به بررسی این افزونه و استفاده از دستور مرتبط با تحلیل واریانس خواهیم پرداخت.

Excel data analysis menu
برگه Data و دستور Data Analysis

در تصویر بالا، محل قرارگیری دستور تحلیل داده (Data Analysis) را در برگه Data مشاهده می‌کنید.

نکته: شرایط استفاده از آزمون یا آنالیز واریانس یک طرفه، در صحت نتایج حاصل تاثیر گذار است. برای مشاهده این شرایط به متن آنالیز واریانس (ANOVA) یک و دو طرفه در R — راهنمای کاربردی مراجعه کنید.

نصب افزونه تحلیل Analysis ToolPak

پس از اجرای اکسل، فهرست File را باز کرده و از بین لیست دستوران آن، آخرین دستور یعنی Options را اجرا کنید. با انجام این کار پنجره‌ای مطابق با تصویر زیر شده می‌شود. کافی از گزینه Add-ins را از لیست سمت چپ انتخاب کرده و در کادر سمت راست در قسمت Manage، دکمه …Go را کلیک کنید.

excel add-ins

پس از انجام این عمل، پنجره‌ای دیگری که شامل افزونه‌های استاندارد (Standard Add-ins) اکسل است، ظاهر می‌شود. کافی است گزینه Analysis ToolPak را انتخاب و دکمه OK را کلیک کنید.

Excel Analysis ToolPack

به این ترتیب دستور Data Analysis در برگه Data در اکسل ظاهر خواهد شد و می‌توانید تحلیل یا آنالیز واریانس را اجرا کنید.

گام‌های اجرای آنالیز واریانس یک طرفه در اکسل

تجزیه و تحلیل واریانس یک طرفه (ANOVA) برای یک «متغیر مستقل» (Independent) از یک عامل (Factor) یا متغیر طبقه‌ای (Categorical Variable) استفاده می‌کند. برای «متغیر وابسته» (Dependent) نیز یک متغیر با مقادیر پیوسته مورد نیاز است.

مقادیر متغیر عامل یا متغیر طبقه‌بندی، داده‌های متغیر وابسته را در گروه‌های جداگانه تقسیم می‌کنند. این آزمون تعیین می‌کند که آیا میانگین اختلاف بین این گروه‌ها از نظر آماری معنی‌دار است یا خیر.

به عنوان مثال در ادامه این متن به مسئله مقاومت چهار نوع آلیاژ برای میله فولادی می‌پردازیم. اگر نوع آلیاژ متغیر طبقه‌بندی باشد، می‌توانید تعیین کنید که آیا تفاوت بین میانگین مقاومت چهار نوع میله در برابر فشار عمودی از نظر آماری قابل وجود دارد یا خیر؟

در این مسئله، فشار قابل تحمل (Strength)، متغیر وابسته (متغیر پیوسته) را تشکیل می‌دهد و نوع آلیاژ ( در چهار نوع مختلف) متغیر طبقه‌ای محسوب می‌شود. توجه دارید که در اینجا یک متغیر طبقه‌ای وجود داشته که دارای چهار سطح مختلف است. این موضوع را نباید با چهار متغیر طبقه‌ای اشتباه کنید.

گام اول: چیدمان داده‌ها

نظام و نحوه چیدمان این مقادیر در اکسل مطابق با تصویر زیر است. میزان مقاومت هر کدام از آلیاژها در یک ستون از جدول نوشته شده است. در نتیجه چهار ستون در کاربرگ اکسل ایجاد کرده و مقادیر را ثبت کرده‌ایم.

dataset for ANOVA
مجموعه داده میزان مقاومت میله برای چهار آلیاژ

البته می‌توانید فایل اطلاعاتی مربوط به این داده‌ها را با قالب فشرده از اینجا دریافت کنید. پس از خارج کردن این فایل از حالت فشرده، آن را در اکسل فراخوانی کنید. البته توجه داشته باشید که این فایل با فرمت csv یا جداکننده کاما، ساخته شده است و مقادیر هر ستون از ستون دیگر با علامت «،» جدا شده است.

گام دوم: اجرای تحلیل واریانس

برای انجام ANOVA یک طرفه در Excel، گزینه Anova: Single Factor در تصویر زیر را پس از اجرای دستور Data Analysis از برگه Data انتخاب کنید.

excel data analysis window
پنجره انتخاب نوع تحلیل در Analysis Tools

نکته: گزینه‌های تحلیل واریانس دو طرفه (Two-Factor) نیز در این پنجره وجود دارد که در نوشتارهای دیگر مجله فرادرس به آن‌ها خواهیم پرداخت.

پس از انتخاب و فشردن دکمه OK، پنجره‌ای که در گام سوم معرفی شده، ظاهر خواهد شد.

گام سوم: تنظیم پارامترهای آنالیز واریانس در اکسل

در پنجره Anova: Single Factor پارامترهای مختلفی را باید برای تحلیل یا آنالیز واریانس یک طرفه در اکسل تعیین کرد.

single factor dialog box
تنظیمات آنالیز واریانس یک طرفه در اکسل

این پارامترها را به صورت فهرست‌وار معرفی می‌کنیم.

  • ناحیه اطلاعاتی (Input Range): در این کادر، ناحیه‌ای را انتخاب می‌کنید که شامل اطلاعات و داده‌های مدل تحلیل یا آنالیز واریانس در کاربرگ اکسل است. معمولا آدرس این سلول‌ها به صورت یک ناحیه پیوسته بوده و با مرجع مطلق مشخص می‌شود.
  • نحوه گروه‌بندی (Grouped By): این پارامتر تعیین می‌کند که گروه‌ها در کاربرگ براساس ستون‌ها (Columns) یا سطرها (Rows) تشکیل شده‌اند.
  • تعیین سطر اول به عنوان برچسب متغیرها (Labels in First Row): اگر سطر اول از جدول اطلاعاتی شامل اسامی ستون‌ها (سطوح متغیرهای طبقه‌ای) است، این گزینه را فعال کنید.
  • تعیین سطح خطای اول آزمون (Alpha): معمولا به عنوان پیش‌فرض مقدار خطای آزمون یا سطح آزمون ۰٫۰۵ در نظر گرفته می‌شود ولی می‌توانید این پارامتر را در این کادر تغییر دهید.
  • تعیین محل خروجی آنالیز واریانس در اکسل (Output Options): گزینه‌های این بخش برای تعیین محل ایجاد جدول آنالیز واریانس به کار می‌روند. گزینه Output Range، برای تعیین سلول اول در یکی از کاربرگ‌های موجود، مورد استفاده دارد. گزینه New Worksheet Ply، نیز خروجی را در یک کاربرگ جدید قرار می‌دهد. آخرین گزینه در این بخش نیز برای جدول آنالیز واریانس از یک کارپوشه جدید کمک می‌گیرد.

گام چهارم: تفسیر خروجی حاصل از آنالیز واریانس یک طرفه در اکسل

پس از انجام تنظیمات، با فشردن دکمه OK خروجی در محل تعیین شده، ظاهر می‌شود. فرض کنید گزینه New Worksheet Ply انتخاب شده و خروجی در یک کاربرگ جدید طبق تصویر زیر ساخته شده است.

anova table in excel
خروجی جدول آنالیز واریانس یک طرفه در اکسل

در گام آخر باید نتایج حاصل از خروجی آنالیز واریانس در اکسل را تفسیر کنیم. ادامه این بخش به توصیف این نتایج اشاره خواهد داشت.

جدول خلاصه نشان می‌دهد که میانگین مقادیر مقاومت در برابر فشار از کمترین 8.837952 برای آلیاژ نوع 4 تا بالاترین سطح 11.20252 برای آلیاژ نوع ۱ در تغییر است. میانگین نمونه‌ها بین گروه‌ها متفاوت است. با این حال، ما باید تعیین کنیم که آیا داده‌های حاصل از نمونه این تصور را ایجاد می‌کند که اختلاف در بین چهار جامعه نیز وجود دارد یا خیر؟ زیرا اختلافاتی که در نمونه‌های خود می‌بینیم ممکن است نتیجه خطای نمونه‌گیری تصادفی باشد.

در جدول ANOVA، مقدار P-value برابر با 0٫031054 است. از آنجا که این مقدار از سطح معناداری ۰٫۰۵ کمتر است، فرضیه صفر را رد می‌کنیم. داده‌های نمونه ما شواهد کافی و محکمی را مبنی بر اختلاف حداقل یکی از گروه‌ها ارائه می‌دهند.

برای کسب اطلاعات بیشتر در مورد سایر آمار موجود در خروجی، به نوشتار تحلیل واریانس (Anova) — مفاهیم و کاربردها یا آنالیز واریانس (ANOVA) یک و دو طرفه در R — راهنمای کاربردی مراجعه کنید.

خروجی آنالیز واریانس یک طرفه چه چیزی را نشان نمی‌دهد؟

همانطور که دیدید، جدول آنالیز واریانس نشان می‌دهد که تفاوت در بین گروه‌ها معنی‌دار است. به این ترتیب یکی از گروه‌ها دارای میانگینی است که با بقیه گروه‌ها فرق دارد. متاسفانه خروجی حاصل از آنالیز واریانس در اکسل نمی‌تواند نشان دهد که این اختلاف ناشی از کدام گروه بوده است.

فیلم آموزش محاسبات آماری با اکسل

اغلب کسانی که در سطح ابتدایی یا متوسط به کار تحلیل داده یا محاسبات آماری می‌پردازند، از اکسل به عنوان ابزار محاسباتی بهره می‌برند. خوشبختانه در یکی از آموزش‌های فرادرس به معرفی قابلیت‌های این نرم‌افزار در انجام تحلیل‌های آماری و اجرای فرمول‌های آماری پرداخته شده است. از آنجایی که ممکن است پیاده‌سازی فرمول‌های آماری در اکسل برای کاربران مبتدی سخت باشد، افزونه‌ای برای انجام این گونه تحلیل‌ها در اکسل تعبیه شده که در فیلم آموزش محاسبات آماری در اکسل نیز به آن اشاره شده است. بعضی از مواردی که در این آموزش در مورد آن بحث و بررسی صورت گرفته در ادامه شرح داده شده‌اند:

  • درس اول: شیوه بدست آوردن شاخص‌های توصیفی (Descriptive Statistics) که نمایی کلی از جامعه و ویژگی‌های آن در اختیار کاربر قرار می‌دهد، از موارد اولیه درس اول محسوب می‌شود. همچنین تشکیل فاصله اطمینان (Confidence Interval) برای میانگین، رسم نمودار هیستوگرام (Histogram)، آزمون فرض مربوط به میانگین جامعه نرمال، آزمون و تجزیه و تحلیل واریانس یک طرفه و دوطرفه، همچنین رگرسیون خطی (Linear regression) و ایجاد اعداد تصادفی (random number generation) از دیگر مواردی است که در درس اول به آن‌ها پرداخته می‌شود.
  • درس دوم: توابع توزیع آماری (distribution function) و معادله خط برگشت (Regression) محاسباتی شامل توابع شاخص‌های تمرکز، شاخص‌های پراکندگی، شاخص‌های تقارن و عدم تقارن، ضرایب همبستگی و کوواریانس، معکوس توابع توزیع آماری و رگرسیون و خط بازگشت است.

statistical computing in excel

خلاصه و جمع‌بندی

در  این نوشتار ما به بررسی نحوه اجرای آنالیز واریانس یک طرفه در اکسل پرداختیم و به کمک یک مثال هم دستورات لازم برای اجرای آن را به کمک افزونه «تحلیل داده» (Data Analysis) بیان کردیم. هر چند اکسل در تحلیل داده‌ها و محاسبات آماری محبوبیت دارد ولی وجود بعضی از محدودیت‌های محاسباتی یا فرمول‌ها، امکان انجام همه گونه آزمون آماری را فراهم نمی‌آورد. بنابراین به ناچار از افزونه‌ها یا توابع از پیش تعریف شده و تحلیل‌های آماری خود را برمبنای آن‌ها به پیش می‌بریم.

اگر این مطلب برای شما مفید بوده است، آموزش‌ها و مطالب زیر نیز به شما پیشنهاد می‌شوند:

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *