آزمون کرویت موچلی و برابری واریانس ها — به زبان ساده

۳۵۳۵ بازدید

آخرین به‌روزرسانی: ۲۴ خرداد ۱۴۰۲

زمان مطالعه: ۸ دقیقه

آزمون کرویت موچلی و برابری واریانس ها — به زبان ساده

در بحث تحلیل واریانس مانند ANOVA با مقادیر تکراری، یکی از فرضیات مورد نظر، برابری واریانس در بین گروه‌ها است که باید توسط یک آزمون آماری مورد بررسی قرار گیرد. یکی از آماره‌ها و روش‌های آزمون فرض برای این کار، «آزمون کرویت موچلی» (Mauchly's Sphericity Test) است. این آزمون توسط بسیاری از نرم‌افزارهای محاسبات آماری قابل اجرا است و براساس نتایج حاصل می‌توان به برابری واریانس در بین گروه‌ها، رای داد. به علت اهمیت این آزمون در تحلیل واریانس (ANOVA) این مطلب از مجله فرادرس را به آزمون کرویت موچلی و برابری واریانس اختصاص داده‌ایم.

فهرست مطالب این نوشته

آزمون کرویت موچلی و برابری واریانس ها

فرضیه‌ها و نحوه عملکرد آزمون کرویت موچلی

نقض فرض کروی بودن

خلاصه و جمع‌بندی

به منظور آشنایی بیشتر با آزمون‌های آماری و تحلیل واریانس بهتر است ابتدا نوشتارهای استنباط و آزمون فرض آماری — مفاهیم و اصطلاحات و تحلیل واریانس (Anova) — مفاهیم و کاربردها را مطالعه کنید. همچنین خواندن مطالب آنالیز واریانس با مقادیر تکراری — از صفر تا صد و تحلیل واریانس اندازه مکرر یک طرفه در SPSS | راهنمای گام به گام نیز خالی از لطف نیست.

آزمون کرویت موچلی و برابری واریانس ها

یکی از آزمون‌هایی که باید در تحلیل واریانس با مقادیر تکراری به کار رود، آزمون «کرویت موچلی» (Mauchly's Sphericity Test) است که برای بررسی یکسان بودن واریانس‌ها در بین گروه‌ها یا تیمارها به کار می‌رود. آماره و آزمون کرویت موچلی در سال ۱۹۴۰ توسط «جان موچلی» (John Mauchly)، فیزیکدان معروف آمریکایی، معرفی و به کار گرفته شد. او در تولید اولین کامپیوترهای الکترونیکی و برنامه‌نویسی برای آن‌ها نیز سهم به سزایی داشت.

جان ماوچلی (John Mauchly) فیزیک‌دان آمریکایی و مخترع کامپیوتر

کروی بودن یا کرویت چیست؟

در نوشتارهای دیگر مجله فرادرس در مورد «تحلیل واریانس با داده مکرر» (Repeated Measure ANOVA) صحبت کردیم. در این بین شرط کروی بودن، یک فرض مهم از تحلیل واریانس (ANOVA) با اندازه‌های مکرر است. این شرط بیان می‌کند که واریانس اختلاف بین همه زوج‌های حاصل از سطوح «متغیر عامل» (Factor Variable) یا «شرایط بین آزمودنی‌ها» (Within-Subject Conditions) باید برابر باشد.

فیلم آموزش آنالیز واریانس با اس پی اس اس SPSS در فرادرس

کلیک کنید

نقض شرط کروی بودن یا کرویت، زمانی اتفاق می‌افتد که حداقل یکی از زوج‌ها دارای واریانس متفاوت با بقیه زوج‌ها باشد. اگر شرط کروی بودن، نقض شود، ممکن است محاسبات مربوط به تحلیل واریانس، تحریف شده و باعث شود که آماره آزمون ANOVA یا همان مقدار F به طور غیرمجاز بزرگ یا «متورم» (Inflated) شود. به این ترتیب بدون آنکه واقعا تفاوت معنی‌داری بین گروه‌ها یا تیمارها وجود داشته باشد، بزرگ بودن آماره F باعث رد فرض صفر در تحلیل واریانس شده و رای به نابرابری میانگین گروه‌ها خواهیم داد. این موضوع نشانگر اهمیت آزمون کرویت در ANOVA با مقادیر تکراری است. همانطور که گفته شد، قصور در اجرای این آزمون، ممکن است نتایج حاصل از آنالیز واریانس را تحریف کند.

زمانی که متغیر عامل دارای ۳ سطح یا بیشتر باشد، از آزمون کرویت می‌توان برابری یا نابرابری واریانس اختلاف بین زوج‌ها را مورد بررسی قرار داد. هر چه تعداد عامل‌ها افزایش یابد، شانس رد کردن فرض صفر یا برابری واریانس‌ها بیشتر می‌شود.

در صورتی که آزمون کرویت رد شود، با توجه انتخاب تحلیل «یک متغیره» (Univariate) یا «چند متغیره» (Multivariate)، باید نسبت به نحوه اجرای آزمون تحلیل واریانس تصمیم گرفت. اگر مسئله «تک متغیره» باشد به این معنی که متغیر پاسخ، یک بردار را تشکیل دهد، استفاده از تحلیل واریانس با مقادیر تکراری (Repeated Measure ANOVA) که تصحیح روی آماره آن صورت گرفته، مناسب است. البته به شرطی که با توجه به میزان یا درجه آزمون کرویت، فرض صفر مردود اعلام شده باشد. در غیر اینصورت استفاده از تحلیل‌های «چند متغیره» مناسب‌تر هستند. این موضوعات در ادامه متن مورد بررسی قرار خواهند گرفت.

اندازه‌گیری کرویت

یک ماتریس اطلاعاتی به مانند قسمت سمت راست جدول ۱ را در نظر بگیرید. این ماتریس براساس سه نوع تیمار (نوع یا میزان داروی مصرفی) روی ۵ بیمار تشکیل شده است. مقدار متغیر پاسخ برای هر یک از این نوع تیمارها در ستون‌های Tx A ،Tx B و Tx C نوشته شده است. در ستون‌های بعدی جدول (سمت چپ) نیز اختلاف زوج‌هایی تشکیل شده از ترکیب‌های دوتایی از این سطوح، دیده می‌شود.

جدول ۱: طرح آنالیز واریانس یک طرفه با اندازه مکرر

بیمار	Tx A	Tx B	Tx C	Tx A - Tx B	Tx A - Tx C	Tx B - Tx C
1	30	27	20	3	10	7
2	35	30	28	5	7	2
3	25	30	20	-5	5	10
4	15	15	12	0	3	3
5	9	12	7	-3	2	5
واریانس				17	10.3	10.3

در سطر آخر جدول، واریانس حاصل از اختلاف زوج‌ها را مشاهده می‌کنید. اگر فرض کرویت برقرار باشد، انتظار داریم که این سه مقدار با هم تقریبا برابر بوده یا از لحاظ آماری، اختلاف معنی‌داری نداشته باشند. البته مشخص است که واریانس بین اختلاف زوج تیمارهای B و C با زوج تیمارهای A و C برابر بوده و مقدار 10٫۳ را نشان می‌دهند. از طرفی، اختلاف زوج تیمار A و B‌ با زوج‌های دیگر اختلاف زیادی دارد، زیرا مقدار واریانس برای اختلاف این دو زوج برابر با 17 است.

به نظر می‌رسد که این مجموعه داده‌، بیانگر نابرابری بین واریانس اختلاف بین گروه‌ها باشد. به منظور بررسی چنین فرضی، از «آزمون کرویت موچلی» استفاده خواهیم کرد.

فرضیه‌ها و نحوه عملکرد آزمون کرویت موچلی

آزمون «کرویت موچلی» یک آزمون فرض آماری رایج برای ارزیابی فرض کروی بودن است. فرض صفر در اینجا وجود خاصیت کرویت و فرض مقابل، غیر کروی بودن را از لحاظ آماری نشان می‌دهد. به این ترتیب با توجه به جدول ۱، آزمون فرض کرویت را با فرض صفر و فرض مقابلی که در زیر می‌بینید، معرفی می‌کنیم.

$$ \large H_{0}: \sigma_{{{\text{Tx A}} - {\text{Tx B}}}}^{2} = \sigma _{{{\text{Tx A}} - {\text{Tx C}}}}^{2} = \sigma_{{{\text{Tx B}} - {\text{Tx C}}}}^{2}\\ \large {\displaystyle H_{1} : {\text{The variances are not all equal}}} $$

فیلم آموزش آزمون آماری و پی مقدار p-value در فرادرس

کلیک کنید

همانطور که می‌بینید، فرض صفر نشانگر یکسان بودن واریانس اختلافات است و فرض مقابل بیانگر نابرابری بین حداقل دو زوج است. همانطور که در جدول ۱ مشاهده می‌شود، پس از اینکه هر یک از اختلاف‌ها محاسبه شده، یک آزمون معمول $$F$$ برای سنجش برابری یا تعیین نسبت بین واریانس‌های اختلاف‌ها صورت می‌گیرد. به این ترتیب با چنین روشی می‌توانیم یک آزمون کرویت تشکیل دهیم. البته به یاد داشته باشید که آزمون F باید بوسیله روش‌هایی مانند «روش بونفرونی» (Bonfferoni Method) که در «پس‌آزمون‌ها» (Post-Hoc) تحلیل واریانس به کار می‌رود، اصلاح شده و همزمان بودن و کنترل خطای آزمون را تضمین کند.

تفسیر آزمون موچلی کاملاً ساده است. هنگامی که «مقدار احتمال» (p-value) برای آماره موچلی کمتر از «احتمال خطای نوع اول» ($$\alpha$$) باشد، فرض کرویت رد می‌شود. بنابراین نتیجه می‌گیریم که تفاوت معنی داری بین واریانس اختلافات وجود دارد.

البته توجه داشته باشید که فرض کرویت بین دو سطح از متغیر عامل در آنالیز واریانس با مقادیر تکراری همیشه برقرار است، به همین علت این آزمون را برای تحلیل‌هایی به کار می‌برند که بیش از سه سطح از متغیر عامل در آن دخالت داشته باشند.

در صورتی که مقدار احتمال یا سطح معنی‌داری آزمون (Sig) از احتمال خطای اول بیشتر یا برابر باشد، دلیلی بر رد فرض صفر وجود ندارد و می‌توانیم فرض کرویت را برای تحلیل واریانس با مقادیر تکراری بپذیریم.

نکته: اکثر نرم افزارهای آماری برای دو سطح از یک متغیر عامل با تحلیل واریانس اندازه مکرر، خروجی تولید نمی‌کنند. با این حال، برخی از نسخه‌های نرم‌افزار SPSS یک جدول خروجی با درجه آزادی برابر با 0 و علامت «.» به جای مقدار احتمال (.Sig) تولید می‌کنند.

نقض فرض کروی بودن

وقتی فرض کروی بودن برقرار باشد، نسبت F تحت فرض صفر، مقداری کوچک خواهد بود. اما اگر آزمون کرویت موچلی معنی‌دار باشد، نسبت‌های F تولید شده برای مقایسه‌های دو تایی، باید با احتیاط تفسیر شوند، زیرا نقض فرض کرویت، می‌تواند منجر به افزایش نرخ خطای نوع اول شده و بر نتیجه‌گیری‌های نهایی در تحلیل واریانس تأثیر بگذارد. در مواردی که آزمون کرویت موچلی معنی‌دار است، باید تغییراتی را در درجه‌های آزادی انجام داد تا نسبت‌های F معتبر و قابل اطمینان شوند.

در نرم‌افزار محاسبات آماری SPSS، سه تصحیح برای آزمون هم‌زمان F صورت می‌گیرد.

تصحیح «گرین‌هاوس- گیسر» (Greenhouse–Geisser correction)
تصحیح «هیون-فلدت» (Huynh–Feldt correction)
تصحیح «کران پایین» (Lower Bound)

فیلم آموزش تئوری احتمالات در فرادرس

کلیک کنید

هر یک از این اصلاحات برای تغییر درجه آزادی ایجاد شده‌اند تا نسبت F با کاهش میزان خطای نوع اول، تعدیل شود. مقدار آماره مربوط به نسبت F در نتیجه اعمال این اصلاحات تغییر نمی‌کند. فقط درجه آزادی این آماره تحت تاثیر قرار خواهد گرفت. آماره آزمون اصلاح شده تحت تصحیح «گرین‌هاوس»، «هیون» و «کران پایین» تحت نام «اپسیلون» (Epsilon) با نماد $$\epsilon$$، در خروجی نرم‌افزار SPSS دیده می‌شوند. اپسیلون اندازه فاصله از فرض کروی بودن را ارائه می‌دهد.

با ارزیابی اپسیلون می‌توان میزان دوری از فرض کرویت را تعیین کرد. اگر واریانس اختلاف بین همه زوج‌های ممکن از گروه‌ها برابر باشند و فرض کروی بودن دقیقاً برقرار گردد، آنگاه اپسیلون با مقدار 1 برابر خواهد بود. مقدار ۱ در این حالت نشانگر عدم خروج از خاصیت کرویت است. در مقابل، اگر واریانس اختلاف بین همه زوج‌های ممکن در بین حداقل دو گروه، نابرابر باشد، فرض کرویت نقض شده و اپسیلون مقداری کمتر از ۱ خواهد داشت. در وضعیت بسیار وخیم و نابرابری قطعی بین واریانس‌ها، مقدار اپسیلون بیشتر از 1 بدست خواهد آمد.

از سه تصحیح یاد شده، روش اصلاحی «هیون-فلدت» کمترین میزان محافظه کاری را دارد، در حالی که تکنیک «گرین‌هاوس» در موارد کمتری رای به عدم ویژگی کرویت می‌دهد. تصحیح «کران پایین» کمترین میزان محافظه کاری را دارد و در اکثر مواقع فرض کرویت را رد کرده و فقط در شرایط کاملا مساعد، این شرط را می‌پذیرد.

هنگامی که اپسیلون بیشتر از 0٫75 بدست آید، اغلب تصحیح «گرین‌هاوس» بسیار محافظه کار شده و منجر به رد نادرست فرض صفر (که کروی بودن است)، می‌شود. می‌توان نشان داد که وقتی اپسیلون تا 0٫90 نیز افزایش یابد، چنین مشکلی همچنان باقی می‌ماند.

به نظر می‌رسد که که روش تصحیح «هیون»، مسیر میانه‌روی را انتخاب کرده است و فرض کرویت را بیش از حد ارزیابی می‌کند. این امر باعث می‌شود که به شکلی نادرست، فرض مقابل را که وجود کرویت را رد می‌کند، به اشتباه غلط در نظر بگیریم. به منظور رفع این مشکل بهتر است، هنگامی که اپسیلون بیشتر از 0٫75 است، از تصحیح «هیون-فلدت» استفاده شود و اگر اپسیلون کمتر از 0٫75 بوده یا هیچ پیش‌زمینه‌ای در مورد کرویت وجود ندارد، از تصحیح «گرین‌هاوس-گیسر» استفاده شود.

Multivariate vs AB testing

نکته: روش دیگر در این حالت جایگزین کردن آماره آزمون با «آماره آزمون چند متغیره تحلیل واریانس» (Multivariate Analysis of Variance Test Statistics) یا MANOVA است، زیرا در این حالت نیازی به فرض کرویت و تصحیح خطای آزمون‌های هم‌زمان وجود ندارد. ولی به یاد داشته باشید که در این حالت، توان آزمون نسبت به توان آزمون تحلیل واریانس با اندازه مکرر، کمتر است. به ویژه هنگامی که اندازه اپسیلون بزرگ نیست یا اندازه نمونه‌ها کوچک هستند.

پیشنهاد می‌شود که وقتی نقض بزرگی از کرویت (مثلاً اپسیلون کمتر از 0٫70) مشاهده می‌شود و اندازه نمونه شما بیشتر از k + 10 است (k نشانگر تعداد سطوح متغیر عامل است)، از تحلیل چند متغیره استفاده شود. زیرا با روش‌های محاسباتی می‌توان نتیجه گرفت که آزمون MANOVA دارای «توان آزمون» (Power of test) بیشتری است. ولی در موارد دیگر، باید تحلیل واریانس اندازه مكرر انتخاب شود. علاوه بر این، توان آزمون MANOVA وابسته به همبستگی بین متغیرهای وابسته نیز هست، بنابراین باید رابطه بین این گونه شرایط نیز در نظر گرفته شود تا به بهترین نحوه تجزیه و تحلیل داده‌ها دست پیدا کرد.

در خروجی تحلیل واریانس اندازه مکرر توسط SPSS آزمون MANOVA براساس چهار نسبت یا آماره آزمون، ارائه می‌شود.

اثر ماتریس پیلایی (Pillai's Trace)
لامبدای ویلک (Wilk's Lambda)
اثر ماتریس هوتلینگ (Hotelling's Trace)
بزرگترین ریشه روی (Roy's Largest Root)

به طور کلی می‌توان ادعا کرد که در آزمون یا تحلیل چند متغیره، «لامبدای ولیک»، به عنوان مناسب‌ترین آماره آزمون در چنین مواردی، قابل استفاده است.

معایب آزمون کرویت موچلی

هر چند، آزمون کرویت موچلی یکی از متداول‌ترین روش‌ها برای ارزیابی فرض کرویت در تحلیل واریانس با مقادیر تکراری محسوب می‌شود، ولی متاسفانه به کمک این آزمون، نمی‌توان فرض کروی بودن را در اندازه نمونه‌های کوچک تشخیص داد. از طرفی اگر اندازه نمونه بزرگ باشد، در اکثر مواقع، فرض کروی بودن توسط این آزمون رد می‌شود. در نتیجه، اندازه نمونه در تفسیر نتایج تأثیر گذار است. در عمل، داشتن فرض کروی بودن بسیار بعید است، بنابراین هنگام استفاده از آن باید دقت و وسواس خاصی داشت تا به غلط، فرضیه‌ای را رد یا تایید نکنیم.

خلاصه و جمع‌بندی

آزمون کرویت موچلی در تحلیل واریانس با اندازه مکرر یا مقادیر تکراری برای ارزیابی پیش‌فرض کرویت در تحلیل واریانس به کار می‌رود. همانطور که در این نوشتار خواندید، این آزمون توسط آماره F و همچنین روش‌های تصحیح، قابل استفاده است. در نرم‌افزار SPSS بخصوص برای تحلیل واریانس با اندازه تکراری از این آماره و آزمون برای سنجش صحت فرض کروی بودن استفاده می‌شود.

بر اساس رای ۱۲ نفر

آیا این مطلب برای شما مفید بود؟

اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

ثبت نظر

منابع:

Wikipedia مجله فرادرس

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

۳ دیدگاه برای «آزمون کرویت موچلی و برابری واریانس ها — به زبان ساده»

سمانه

۰۱ تیر، در ۱۴۰۰ ۴:۰۳ ب.ظ

سلام در طرح تحلیل واریانس ترکیبی ساده چرا در فرمول بندی مخرج F عامل درون ازمودنی بعنوان عامل خطا همان عامل خطا و مخرج F تعاملی عامل درون ازمودنی و بین ازمودنی است؟

چرا خطای درون ازمودنی با تعاملی در واریانس ترکیبی ساده یکی است؟

پاسخ

وحید

۰۸ آذر، در ۱۳۹۹ ۵:۴۰ ب.ظ

سلام خسته نباشید. باتشکر از حمات شما. یه سوال داشتم. اگر سطح معنی داری مربوط به آزمون کرویت موچلی بزرگتر از 0/05 باشه و فرض کرویت یا نرمال بودن توزیع چند متغیری داده ها برقرار باشه، برای گزارش در بخش اثرات درون گروهی از چه آزمونی استفاده کنیم؟

پاسخ

آرمان ری بد

۰۹ آذر، در ۱۳۹۹ ۸:۴۵ ق.ظ

سلام و روز بخیر
با توجه به وضعیت گفته شده، امکان اجرای طرح‌های آنالیز واریانس وجود دارد. همانطور که می‌دانید، در یک طرح واریانس یا کوواریانس، باید واریانس درون گروه‌ها با یکدیگر برابر باشد. با توجه به آزمون موچلی و نرمال بودن توزیع داده‌ها، روش‌های آنالیز واریانس کارساز خواهند بود.

با تشکر فراوان
تندرست و پاینده باشید.

نظر شما چیست؟

برچسب‌ها

آزمون کرویت موچلی و برابری واریانس ها — به زبان ساده

آزمون کرویت موچلی و برابری واریانس ها

کروی بودن یا کرویت چیست؟

اندازه‌گیری کرویت

فرضیه‌ها و نحوه عملکرد آزمون کرویت موچلی

نقض فرض کروی بودن

معایب آزمون کرویت موچلی

خلاصه و جمع‌بندی

الگوریتم های طبقه بندی – توضیح ۸ الگوریتم به زبان ساده

SPSS چیست و چه کاربرد و ويژگی‌هایی دارد؟

انحراف معیار چیست؟ – به زبان ساده با مثال

فرآیند پواسون و توزیع آن – به زبان ساده + مفاهیم و کاربردها

مسئله تانک آلمانی – آشنایی و پیاده سازی در پایتون

روش شش سیگما چیست؟ – به زبان ساده

پیاده سازی الگوریتم ژنتیک در پایتون – راهنمای گام به گام

پیاده سازی الگوریتم K نزدیکترین همسایه یا KNN برای رگرسیون در پایتون

دستور randn در متلب – آموزش تولید اعداد تصادفی + کد و مثال

پیاده سازی اندیکاتور شاخص قدرت نسبی RSI در پایتون — راهنمای گام به گام