آزمون کرویت موچلی و برابری واریانس ها – به زبان ساده


در بحث تحلیل واریانس مانند ANOVA با مقادیر تکراری، یکی از فرضیات مورد نظر، برابری واریانس در بین گروهها است که باید توسط یک آزمون آماری مورد بررسی قرار گیرد. یکی از آمارهها و روشهای آزمون فرض برای این کار، «آزمون کرویت موچلی» (Mauchly's Sphericity Test) است. این آزمون توسط بسیاری از نرمافزارهای محاسبات آماری قابل اجرا است و براساس نتایج حاصل میتوان به برابری واریانس در بین گروهها، رای داد. به علت اهمیت این آزمون در تحلیل واریانس (ANOVA) این مطلب از مجله فرادرس را به آزمون کرویت موچلی و برابری واریانس اختصاص دادهایم.
به منظور آشنایی بیشتر با آزمونهای آماری و تحلیل واریانس بهتر است ابتدا نوشتارهای استنباط و آزمون فرض آماری — مفاهیم و اصطلاحات و تحلیل واریانس (Anova) — مفاهیم و کاربردها را مطالعه کنید. همچنین خواندن مطالب آنالیز واریانس با مقادیر تکراری — از صفر تا صد و تحلیل واریانس اندازه مکرر یک طرفه در SPSS | راهنمای گام به گام نیز خالی از لطف نیست.
آزمون کرویت موچلی و برابری واریانس ها
یکی از آزمونهایی که باید در تحلیل واریانس با مقادیر تکراری به کار رود، آزمون «کرویت موچلی» (Mauchly's Sphericity Test) است که برای بررسی یکسان بودن واریانسها در بین گروهها یا تیمارها به کار میرود. آماره و آزمون کرویت موچلی در سال ۱۹۴۰ توسط «جان موچلی» (John Mauchly)، فیزیکدان معروف آمریکایی، معرفی و به کار گرفته شد. او در تولید اولین کامپیوترهای الکترونیکی و برنامهنویسی برای آنها نیز سهم به سزایی داشت.

کروی بودن یا کرویت چیست؟
در نوشتارهای دیگر مجله فرادرس در مورد «تحلیل واریانس با داده مکرر» (Repeated Measure ANOVA) صحبت کردیم. در این بین شرط کروی بودن، یک فرض مهم از تحلیل واریانس (ANOVA) با اندازههای مکرر است. این شرط بیان میکند که واریانس اختلاف بین همه زوجهای حاصل از سطوح «متغیر عامل» (Factor Variable) یا «شرایط بین آزمودنیها» (Within-Subject Conditions) باید برابر باشد.
نقض شرط کروی بودن یا کرویت، زمانی اتفاق میافتد که حداقل یکی از زوجها دارای واریانس متفاوت با بقیه زوجها باشد. اگر شرط کروی بودن، نقض شود، ممکن است محاسبات مربوط به تحلیل واریانس، تحریف شده و باعث شود که آماره آزمون ANOVA یا همان مقدار F به طور غیرمجاز بزرگ یا «متورم» (Inflated) شود. به این ترتیب بدون آنکه واقعا تفاوت معنیداری بین گروهها یا تیمارها وجود داشته باشد، بزرگ بودن آماره F باعث رد فرض صفر در تحلیل واریانس شده و رای به نابرابری میانگین گروهها خواهیم داد. این موضوع نشانگر اهمیت آزمون کرویت در ANOVA با مقادیر تکراری است. همانطور که گفته شد، قصور در اجرای این آزمون، ممکن است نتایج حاصل از آنالیز واریانس را تحریف کند.
زمانی که متغیر عامل دارای ۳ سطح یا بیشتر باشد، از آزمون کرویت میتوان برابری یا نابرابری واریانس اختلاف بین زوجها را مورد بررسی قرار داد. هر چه تعداد عاملها افزایش یابد، شانس رد کردن فرض صفر یا برابری واریانسها بیشتر میشود.
در صورتی که آزمون کرویت رد شود، با توجه انتخاب تحلیل «یک متغیره» (Univariate) یا «چند متغیره» (Multivariate)، باید نسبت به نحوه اجرای آزمون تحلیل واریانس تصمیم گرفت. اگر مسئله «تک متغیره» باشد به این معنی که متغیر پاسخ، یک بردار را تشکیل دهد، استفاده از تحلیل واریانس با مقادیر تکراری (Repeated Measure ANOVA) که تصحیح روی آماره آن صورت گرفته، مناسب است. البته به شرطی که با توجه به میزان یا درجه آزمون کرویت، فرض صفر مردود اعلام شده باشد. در غیر اینصورت استفاده از تحلیلهای «چند متغیره» مناسبتر هستند. این موضوعات در ادامه متن مورد بررسی قرار خواهند گرفت.
اندازهگیری کرویت
یک ماتریس اطلاعاتی به مانند قسمت سمت راست جدول ۱ را در نظر بگیرید. این ماتریس براساس سه نوع تیمار (نوع یا میزان داروی مصرفی) روی ۵ بیمار تشکیل شده است. مقدار متغیر پاسخ برای هر یک از این نوع تیمارها در ستونهای Tx A ،Tx B و Tx C نوشته شده است. در ستونهای بعدی جدول (سمت چپ) نیز اختلاف زوجهایی تشکیل شده از ترکیبهای دوتایی از این سطوح، دیده میشود.
جدول ۱: طرح آنالیز واریانس یک طرفه با اندازه مکرر
بیمار | Tx A | Tx B | Tx C | Tx A - Tx B | Tx A - Tx C | Tx B - Tx C |
1 | 30 | 27 | 20 | 3 | 10 | 7 |
2 | 35 | 30 | 28 | 5 | 7 | 2 |
3 | 25 | 30 | 20 | -5 | 5 | 10 |
4 | 15 | 15 | 12 | 0 | 3 | 3 |
5 | 9 | 12 | 7 | -3 | 2 | 5 |
واریانس | 17 | 10.3 | 10.3 |
در سطر آخر جدول، واریانس حاصل از اختلاف زوجها را مشاهده میکنید. اگر فرض کرویت برقرار باشد، انتظار داریم که این سه مقدار با هم تقریبا برابر بوده یا از لحاظ آماری، اختلاف معنیداری نداشته باشند. البته مشخص است که واریانس بین اختلاف زوج تیمارهای B و C با زوج تیمارهای A و C برابر بوده و مقدار 10٫۳ را نشان میدهند. از طرفی، اختلاف زوج تیمار A و B با زوجهای دیگر اختلاف زیادی دارد، زیرا مقدار واریانس برای اختلاف این دو زوج برابر با 17 است.
به نظر میرسد که این مجموعه داده، بیانگر نابرابری بین واریانس اختلاف بین گروهها باشد. به منظور بررسی چنین فرضی، از «آزمون کرویت موچلی» استفاده خواهیم کرد.
فرضیهها و نحوه عملکرد آزمون کرویت موچلی
آزمون «کرویت موچلی» یک آزمون فرض آماری رایج برای ارزیابی فرض کروی بودن است. فرض صفر در اینجا وجود خاصیت کرویت و فرض مقابل، غیر کروی بودن را از لحاظ آماری نشان میدهد. به این ترتیب با توجه به جدول ۱، آزمون فرض کرویت را با فرض صفر و فرض مقابلی که در زیر میبینید، معرفی میکنیم.
همانطور که میبینید، فرض صفر نشانگر یکسان بودن واریانس اختلافات است و فرض مقابل بیانگر نابرابری بین حداقل دو زوج است. همانطور که در جدول ۱ مشاهده میشود، پس از اینکه هر یک از اختلافها محاسبه شده، یک آزمون معمول برای سنجش برابری یا تعیین نسبت بین واریانسهای اختلافها صورت میگیرد. به این ترتیب با چنین روشی میتوانیم یک آزمون کرویت تشکیل دهیم. البته به یاد داشته باشید که آزمون F باید بوسیله روشهایی مانند «روش بونفرونی» (Bonfferoni Method) که در «پسآزمونها» (Post-Hoc) تحلیل واریانس به کار میرود، اصلاح شده و همزمان بودن و کنترل خطای آزمون را تضمین کند.
تفسیر آزمون موچلی کاملاً ساده است. هنگامی که «مقدار احتمال» (p-value) برای آماره موچلی کمتر از «احتمال خطای نوع اول» () باشد، فرض کرویت رد میشود. بنابراین نتیجه میگیریم که تفاوت معنی داری بین واریانس اختلافات وجود دارد.
البته توجه داشته باشید که فرض کرویت بین دو سطح از متغیر عامل در آنالیز واریانس با مقادیر تکراری همیشه برقرار است، به همین علت این آزمون را برای تحلیلهایی به کار میبرند که بیش از سه سطح از متغیر عامل در آن دخالت داشته باشند.
در صورتی که مقدار احتمال یا سطح معنیداری آزمون (Sig) از احتمال خطای اول بیشتر یا برابر باشد، دلیلی بر رد فرض صفر وجود ندارد و میتوانیم فرض کرویت را برای تحلیل واریانس با مقادیر تکراری بپذیریم.
نکته: اکثر نرم افزارهای آماری برای دو سطح از یک متغیر عامل با تحلیل واریانس اندازه مکرر، خروجی تولید نمیکنند. با این حال، برخی از نسخههای نرمافزار SPSS یک جدول خروجی با درجه آزادی برابر با 0 و علامت «.» به جای مقدار احتمال (.Sig) تولید میکنند.
نقض فرض کروی بودن
وقتی فرض کروی بودن برقرار باشد، نسبت F تحت فرض صفر، مقداری کوچک خواهد بود. اما اگر آزمون کرویت موچلی معنیدار باشد، نسبتهای F تولید شده برای مقایسههای دو تایی، باید با احتیاط تفسیر شوند، زیرا نقض فرض کرویت، میتواند منجر به افزایش نرخ خطای نوع اول شده و بر نتیجهگیریهای نهایی در تحلیل واریانس تأثیر بگذارد. در مواردی که آزمون کرویت موچلی معنیدار است، باید تغییراتی را در درجههای آزادی انجام داد تا نسبتهای F معتبر و قابل اطمینان شوند.
در نرمافزار محاسبات آماری SPSS، سه تصحیح برای آزمون همزمان F صورت میگیرد.
- تصحیح «گرینهاوس- گیسر» (Greenhouse–Geisser correction)
- تصحیح «هیون-فلدت» (Huynh–Feldt correction)
- تصحیح «کران پایین» (Lower Bound)
هر یک از این اصلاحات برای تغییر درجه آزادی ایجاد شدهاند تا نسبت F با کاهش میزان خطای نوع اول، تعدیل شود. مقدار آماره مربوط به نسبت F در نتیجه اعمال این اصلاحات تغییر نمیکند. فقط درجه آزادی این آماره تحت تاثیر قرار خواهد گرفت. آماره آزمون اصلاح شده تحت تصحیح «گرینهاوس»، «هیون» و «کران پایین» تحت نام «اپسیلون» (Epsilon) با نماد ، در خروجی نرمافزار SPSS دیده میشوند. اپسیلون اندازه فاصله از فرض کروی بودن را ارائه میدهد.
با ارزیابی اپسیلون میتوان میزان دوری از فرض کرویت را تعیین کرد. اگر واریانس اختلاف بین همه زوجهای ممکن از گروهها برابر باشند و فرض کروی بودن دقیقاً برقرار گردد، آنگاه اپسیلون با مقدار 1 برابر خواهد بود. مقدار ۱ در این حالت نشانگر عدم خروج از خاصیت کرویت است. در مقابل، اگر واریانس اختلاف بین همه زوجهای ممکن در بین حداقل دو گروه، نابرابر باشد، فرض کرویت نقض شده و اپسیلون مقداری کمتر از ۱ خواهد داشت. در وضعیت بسیار وخیم و نابرابری قطعی بین واریانسها، مقدار اپسیلون بیشتر از 1 بدست خواهد آمد.
از سه تصحیح یاد شده، روش اصلاحی «هیون-فلدت» کمترین میزان محافظه کاری را دارد، در حالی که تکنیک «گرینهاوس» در موارد کمتری رای به عدم ویژگی کرویت میدهد. تصحیح «کران پایین» کمترین میزان محافظه کاری را دارد و در اکثر مواقع فرض کرویت را رد کرده و فقط در شرایط کاملا مساعد، این شرط را میپذیرد.
هنگامی که اپسیلون بیشتر از 0٫75 بدست آید، اغلب تصحیح «گرینهاوس» بسیار محافظه کار شده و منجر به رد نادرست فرض صفر (که کروی بودن است)، میشود. میتوان نشان داد که وقتی اپسیلون تا 0٫90 نیز افزایش یابد، چنین مشکلی همچنان باقی میماند.
به نظر میرسد که که روش تصحیح «هیون»، مسیر میانهروی را انتخاب کرده است و فرض کرویت را بیش از حد ارزیابی میکند. این امر باعث میشود که به شکلی نادرست، فرض مقابل را که وجود کرویت را رد میکند، به اشتباه غلط در نظر بگیریم. به منظور رفع این مشکل بهتر است، هنگامی که اپسیلون بیشتر از 0٫75 است، از تصحیح «هیون-فلدت» استفاده شود و اگر اپسیلون کمتر از 0٫75 بوده یا هیچ پیشزمینهای در مورد کرویت وجود ندارد، از تصحیح «گرینهاوس-گیسر» استفاده شود.
نکته: روش دیگر در این حالت جایگزین کردن آماره آزمون با «آماره آزمون چند متغیره تحلیل واریانس» (Multivariate Analysis of Variance Test Statistics) یا MANOVA است، زیرا در این حالت نیازی به فرض کرویت و تصحیح خطای آزمونهای همزمان وجود ندارد. ولی به یاد داشته باشید که در این حالت، توان آزمون نسبت به توان آزمون تحلیل واریانس با اندازه مکرر، کمتر است. به ویژه هنگامی که اندازه اپسیلون بزرگ نیست یا اندازه نمونهها کوچک هستند.
پیشنهاد میشود که وقتی نقض بزرگی از کرویت (مثلاً اپسیلون کمتر از 0٫70) مشاهده میشود و اندازه نمونه شما بیشتر از k + 10 است (k نشانگر تعداد سطوح متغیر عامل است)، از تحلیل چند متغیره استفاده شود. زیرا با روشهای محاسباتی میتوان نتیجه گرفت که آزمون MANOVA دارای «توان آزمون» (Power of test) بیشتری است. ولی در موارد دیگر، باید تحلیل واریانس اندازه مكرر انتخاب شود. علاوه بر این، توان آزمون MANOVA وابسته به همبستگی بین متغیرهای وابسته نیز هست، بنابراین باید رابطه بین این گونه شرایط نیز در نظر گرفته شود تا به بهترین نحوه تجزیه و تحلیل دادهها دست پیدا کرد.
در خروجی تحلیل واریانس اندازه مکرر توسط SPSS آزمون MANOVA براساس چهار نسبت یا آماره آزمون، ارائه میشود.
- اثر ماتریس پیلایی (Pillai's Trace)
- لامبدای ویلک (Wilk's Lambda)
- اثر ماتریس هوتلینگ (Hotelling's Trace)
- بزرگترین ریشه روی (Roy's Largest Root)
به طور کلی میتوان ادعا کرد که در آزمون یا تحلیل چند متغیره، «لامبدای ولیک»، به عنوان مناسبترین آماره آزمون در چنین مواردی، قابل استفاده است.
معایب آزمون کرویت موچلی
هر چند، آزمون کرویت موچلی یکی از متداولترین روشها برای ارزیابی فرض کرویت در تحلیل واریانس با مقادیر تکراری محسوب میشود، ولی متاسفانه به کمک این آزمون، نمیتوان فرض کروی بودن را در اندازه نمونههای کوچک تشخیص داد. از طرفی اگر اندازه نمونه بزرگ باشد، در اکثر مواقع، فرض کروی بودن توسط این آزمون رد میشود. در نتیجه، اندازه نمونه در تفسیر نتایج تأثیر گذار است. در عمل، داشتن فرض کروی بودن بسیار بعید است، بنابراین هنگام استفاده از آن باید دقت و وسواس خاصی داشت تا به غلط، فرضیهای را رد یا تایید نکنیم.
خلاصه و جمعبندی
آزمون کرویت موچلی در تحلیل واریانس با اندازه مکرر یا مقادیر تکراری برای ارزیابی پیشفرض کرویت در تحلیل واریانس به کار میرود. همانطور که در این نوشتار خواندید، این آزمون توسط آماره F و همچنین روشهای تصحیح، قابل استفاده است. در نرمافزار SPSS بخصوص برای تحلیل واریانس با اندازه تکراری از این آماره و آزمون برای سنجش صحت فرض کروی بودن استفاده میشود.
سلام در طرح تحلیل واریانس ترکیبی ساده چرا در فرمول بندی مخرج F عامل درون ازمودنی بعنوان عامل خطا همان عامل خطا و مخرج F تعاملی عامل درون ازمودنی و بین ازمودنی است؟
چرا خطای درون ازمودنی با تعاملی در واریانس ترکیبی ساده یکی است؟
سلام خسته نباشید. باتشکر از حمات شما. یه سوال داشتم. اگر سطح معنی داری مربوط به آزمون کرویت موچلی بزرگتر از 0/05 باشه و فرض کرویت یا نرمال بودن توزیع چند متغیری داده ها برقرار باشه، برای گزارش در بخش اثرات درون گروهی از چه آزمونی استفاده کنیم؟
سلام و روز بخیر
با توجه به وضعیت گفته شده، امکان اجرای طرحهای آنالیز واریانس وجود دارد. همانطور که میدانید، در یک طرح واریانس یا کوواریانس، باید واریانس درون گروهها با یکدیگر برابر باشد. با توجه به آزمون موچلی و نرمال بودن توزیع دادهها، روشهای آنالیز واریانس کارساز خواهند بود.
با تشکر فراوان
تندرست و پاینده باشید.