آزمون علامت (Sign Test) – به زبان ساده


در حوزه آمار، آزمونهای آماری از اهمیت خاصی برخوردار هستند. به کمک آزمونهای آماری میتوانیم براساس نمونههای تصادفی در مورد پارامتر جامعه، دست به قضاوت بزنیم. روشهای انجام آزمونهای آماری به دو گروه آزمونهای پارامتری و آزمونهای ناپارامتری تقسیم میشود. «آزمون علامت» (Sign Test) از گروه آزمونهای ناپارامتری بوده و برای دادههای ترتیبی مناسب است.
به منظور آشنایی با روشهای پارامتری و ناپارامتری بهتر است مطلب آمار پارامتری و ناپارامتری — انتخاب روش های تحلیل را مطالعه کنید. از طرفی برای آشنایی با اصطلاحات مربوط به آزمونهای آماری خواندن نوشتار آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات مناسب به نظر میرسد. همچنین مرور مطلب مقدار احتمال (p-Value) — معیاری ساده برای انجام آزمون فرض آماری نیز خالی از لطف نیست.
آزمون علامت
آزمون علامت، متعلق به گروه روشهای استنباط آماری ناپارامتری است و برای تشخیص اختلاف بین زوج مشاهدات مناسب است. برای مثال میتوان وضعیت تغییر وزن افراد را براساس این آزمون مورد تجزیه و تحلیل قرار داد. به این ترتیب آماره آزمون علامت براساس افزایش، کاهش یا ثابت بودن وزن افراد محاسبه میشود. فرض کنید وزن افراد قبل از انجام رژیم درمانی در متغیر ثبت شده است. وزن همین اشخاص بعد از انجام رژیم درمانی نیز در متغیر نگهداری میشود. به این ترتیب زوج مرتب بیانگر یک مشاهده از نمونه تصادفی است. آماره آزمون در این حالت براساس روابط شکل میگیرد. هر یک از این حالتها را میتوان با نماد «--»، «+» یا «۰» نشان داد.
به بیان دیگر اگر متغیرهای و عددی و از نوع پیوسته باشند، میتوان آزمون علامت را به صورت یک فرض آماری در نظر گرفت که نشان میدهد مقدار میانه اختلاف مربوط به این دو متغیر برابر با صفر است یا خیر. از طرفی از این آزمون برای قضاوت در مورد میانه یک نمونه تصادفی نیز میتوان استفاده کرد. به این ترتیب میتوانیم تصمیم بگیریم که آیا میانه اعداد با مقدار مشخصی برابر است یا خیر. برای مثال میتوانیم برای تعیین اینکه آیا میانه نمرات یک کلاس برابر با ۱۷ است با نمونههای تصادفی آزمون فرض را اجرا کنیم.
نکته: همانطور که گفته شد، آماره آزمون علامت براساس روابط بزرگتر یا کوچکتر و یا مساوی شکل میگیرد. ولی اگر رابطه بین زوج مشاهدات را بتوان به صورت عددی (مانند آزمون T) نشان داد دقت و توان آزمون بیشتر از توان آزمون علامت خواهد بود.
آزمون علامت از گروه آزمونهای ناپارامتری محسوب میشود در نتیجه احتیاج به اطلاعاتی در مورد توزیع دادههای مربوط به جامعه آماری، ندارد. به این ترتیب نیازی به نرمال بودن توزیع دادهها برای انجام چنین آزمونی وجود ندارد. به همین علت در بسیاری از موارد قابل استفاده بوده ولی متاسفانه توان آزمون نسبت به دیگر آزمونهای مشابه کوچکتر است. از طرفی از این آزمون برای انجام آزمونهای یک طرفه و دو طرفه نیز میتوان استفاده کرد.
تاریخچه
«جان آربوتنات» (John Arbuthnot) در سال ۱۷۱۰ به بررسی تعداد تولدها در شهر لندن از تاریخ 1629 تا 1710 پرداخت. در این دوره به نظر میرسید که تعداد پسرهای متولد شده از دختران بیشتر است. او در مقالهای که در آن دوره به چاپ رساند اولین بار واژه «آزمون بامعنایی» (Significance Tests) را به کار برد.
در سالهای 1710 تا ۱۷۱۳ «نیکولاس برنولی» (Nicholas Bernoulli) تحلیلها و نتایج آماری او را بررسی کرده و نتیجه گرفت که بیشتر تغییرات موالید در سال مربوط به تولد پسران است که بوسیله توزیع دو جملهای با پارامتر احتمال توصیف میشود. به نظر میرسد اولین بار در بررسیهای «برنولی» است که از توزیع دوجملهای برای برازش دادههای واقعی استفاده شده است. در سال ۱۹۹۹ «کونور» (Conover) و «اسپرنت» (Sprent) به توصیف دستآوردهای «آربوتنات» علاقمند شدند و سعی کردند به زبان و بیان آزمون فرض آماری نظریه او را که نشان میداد نرخ تولد پسران با دختران یکسان نیست، مورد بررسی قرار دهند.
نحوه محاسبه آماره آزمون علامت
به منظور استفاده از آزمون علامت باید زوجهای نمونه، تصادفی باشند. به این معنی که هر یک از مولفههای تشکیل دهنده زوج مرتب باید به صورت تصادفی از جامعه گرفته شده باشند و از طرفی با یکدیگر مرتبط باشند تا مفهوم زوج وجود داشته باشد.
فرض کنید باشد و فرض صفر نیز به صورت در نظر گرفته شود. به این ترتیب به نظر میرسد که فرض صفر بیانگر آن است که برای زوج مشاهده و پیشامد بزرگتر بودن مولفه اول از دومی در بیشتر موارد وجود دارد. در نظر بگیرید که یک نمونه تایی از زوج مشاهدات به صورت باشند. از این مجموعه، زوجهایی که با یکدیگر یکسان هستند را خارج میکنیم. در نتیجه ممکن است تعداد زوجهای نمونه تصادفی به تا کاهش پیدا کند. در این حالت اگر را تعداد زوجهایی در نظر بگیریم که در آنها با توجه به فرض صفر، توزیع دوجملهای با پارامتر و 0.5 است.
واضح است که در اینجا منظور از تابع نشانگر است، به این معنی که اگر مثبت باشد، مقدار آن ۱ و اگر منفی باشد مقدار آن ۰ است. به نظر میرسد که به این ترتیب الگو موفقیت و شکست مربوط به آزمایش برنولی ایجاد شده و جمع آنها از توزیع دو جملهای پیروی میکند.
نکته: زمانی که مقدار با برابر باشد، میگوییم به اصطلاح گره اتفاق افتاده است. در آزمون علامت، نمونههایی که گرهدار هستند حذف شده و از مابقی نمونه برای انجام آزمون استفاده میشود.
به این ترتیب با توجه به توزیع دوجملهای برای میتوان از آزمون دوجملهای نیز برای این حالت استفاده کرد. البته همانطور که میدانید برای زمانی که باشد میتوان از تقریب توزیع نرمال برای توزیع دوجملهای هم بهره گرفت.
آزمون یک طرفه را میتوان به کمک مقدار احتمال انجام داد. به این ترتیب مشخص میشود که مقدارهای دارای رتبه بزرگتری نسبت به مقدارهای هستند. به همین ترتیب برای آزمون یک طرفه نیز کافی است که مقدار احتمال را برمبنای در نظر گرفت و نشان داد که مقدارهای دارای مرتبه بزرگتری نسبت به هستند. در حالتی که آزمون دو طرفه باشد، مقدار احتمال نیز برابر با «دو برابر کوچکترین مقدار احتمال مربوط به آزمونهای یک طرفه» خواهد بود.
مثال 1
به منظور بررسی تناسب پاهای چپ نوعی گوزن اطلاعاتی از طول پای چپ عقب و جلو ۱۰ گوزن ثبت شده است. میخواهیم آزمون کنیم که آیا این طولها با یکدیگر از لحاظ آماری اختلاف معنیداری دارند یا خیر. این اطلاعات مطابق جدول ثبت شدهاند.
شماره نمونه | طول پای چپ-جلو | طول پای چپ-عقب | اختلاف |
1 | 142 | 138 | + |
2 | 140 | 136 | + |
3 | 144 | 147 | - |
4 | 144 | 139 | + |
5 | 142 | 143 | - |
6 | 146 | 141 | + |
7 | 149 | 143 | + |
8 | 150 | 145 | + |
9 | 142 | 136 | + |
10 | 148 | 146 | + |
در اینجا فرض صفر، به صورت یکسان بودن طول پاهای جلویی و عقبی در نظر گرفته شده است. در فرض مقابل نیز وجود اختلاف در طول پاها لحاظ شده در نتیجه آزمون به صورت دو طرفه خواهد بود. بنابراین باید آماره آزمون یا خیلی بزرگ (بزرگتر یا مساوی ۸) یا خیلی کوچک (کمتر از ۲) باشد تا فرض صفر رد شود.
واضح است که به این معنی که هیچ زوجی دارای مقدار برابر در و نیستند. تعداد علامتهای مثبت (+) 8 و تعداد علامتهای منفی (-) نیز 2 است. اگر فرض صفر صحیح باشد، با توجه به توزیع دو جملهای برای اختلافها با پارامترهای 10 و 0.5 انتظار میرود که 5 علامت (+) وجود داشته باشد. به این ترتیب باید مقدارهای زیر را محاسبه کنیم.
بنابراین با توجه به سطح آزمون ۵٪ (0.05) این نمونه، دلیل بر رد فرض صفر (یکسان بودن طول پاها) ارائه نمیدهد.
مثال ۲
در یک فروشگاه دو محصول A و B وجود دارند. فروشنده میخواهد بسنجد که تمایل مشتریان به کدام محصول بیشتر است. از ده خریدار درخواست میکند که نظر خود را در مورد ترجیح خرید از بین دو محصول A و B اعلام کنند. در اینجا فرض صفر یکسان بودن احتمال انتخاب هر یک از محصولات است، در حالیکه میتوانیم فرض مقابل را ترجیح محصول B بر A در نظر بگیریم. بنابراین اگر p را احتمال انتخاب محصول B بر A در نظر بگیریم، خواهیم داشت.
براساس مشاهدات و نظرسنجی از این نمونه ۱۰ تایی از مشتریان، اطلاعات زیر بدست آمده است:
- تعداد علامتهای + = ۸ (این به معنی ترجیح محصول B بر محصول A توسط ۸ نفر است.)
- تعداد علامتهایی - = 1 (این به معنی ترجیح محصول A بر محصول B توسط ۱ نفر است.)
- تعداد گرهها = ۱ (این به معنی عدم ترجیح یکی بر دیگری توسط ۱ نفر است.)
از آنجایی که تعدا گرهها باید از تعداد مشاهدات کم شود، در اینجا m=9 در نظر گرفته میشود. احتمال اینکه تعداد مثبتها زیاد (بزرگتر از ۸ باشد) چقدر است؟ اگر فرض صفر صحیح باشد، خواهیم داشت:
با توجه به در نظر گرفتن سطح آزمون فرض صفر رد میشود. بنابراین به نظر میرسد که محصول B نسبت به A دارای تمایل یا ترجیح بیشتری در بین مشتریان است.
مثال ۳
طول عمر بیمارانی که دچار سرطان هستند مورد بررسی قرار گرفته است. از بین پروندههای این بیماران ۱۰ نمونه تصادفی انتخاب شده و طول هفتههایی که از زمان مثبت بودن آزمایش تا مرگشان طی شده استخراج شده است. یک نفر نیز با توجه به این که مقدار +۳۶۲ برایش ثبت شده تایید شده که تا پایان دوره بررسیها زنده مانده است. اطلاعات به صورت زیر ثبت و مورد بررسی قرار گرفتهاند.
قرار است با توجه به این دادهها، قضاوت کنیم که میانه طول عمر این گونه بیماران بیشتر یا کمتر از ۲۰۰ هفته است. به این ترتیب به نظر میرسد که فرض صفر و فرض مقابل به صورت زیر نوشته میشوند.
با توجه به خصوصیات آزمون علامت مشخص است که افرادی که بیش از ۲۰۰ هفته عمر کردهاند با علامت + و کسانی که کمتر از ۲۰۰ هفته زندگی کردهاند نیز با علامت - متمایز میشوند. این کار درست به مانند روشی است که برای سنجش میزان اختلاف بین زوجها به کار بردیم. اگر فرض صفر صحیح باشد، نیمی از بیماران باید طول عمری بیشتر از ۲۰۰ یا کمتر از آن داشته باشند.
براساس دادههای جمعآوری شده تعداد علامتهای (+) برابر با ۷ و تعداد علامتهای (-) نیز ۳ است. تعداد مثبتها (+) با در نظر گرفتن صحیح بودن فرض صفر دارای توزیع دوجملهای با پارامترهای n=10 و p=0.5 است. بنابراین مقدار احتمال مشاهده بیش از ۷ یا کمتر از ۳ بیمار معیار انجام آزمون است.
احتمالات مربوطه برای هر مقدار از تعداد بیماران با توجه به توزیع دو جملهای با پارامتر n=10 و p=0.5 در جدول زیر آمده است.
k | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Pr | 0.0010 | 0.0098 | 0.0439 | 0.1172 | 0.2051 | 0.2461 | 0.2051 | 0.1172 | 0.0439 | 0.0098 | 0.0010 |
به این ترتیب احتمال مورد نظر باید از نقاط 0,1,2,3,7,8,9,10 تشکیل شود. بنابراین مجموع احتمالات برای این نقاط برابر است با:
که اگر آزمون را در سطح 0.05 در نظر بگیریم، این نمونه دلیلی برای رد فرض صفر ندارد. در نتیجه به نظر میرسد که میانه طول عمر این بیماران برابر با ۲۰۰ هفته خواهد بود. البته ممکن است با توجه به افزایش حجم نمونه بتوان آزمون پرتوانتری داشت و به نتیجه بهتر و دقیقتری رسید.
نرمافزارهای اجرای آزمون علامت
از آنجایی که آزمون علامت را میتوان حالت خاصی از آزمون دوجملهای در نظر گرفت در بیشتر نرمافزارهای محاسبات آماری امکان اجرای آن وجود دارد. برای مثال اگر لازم باشد در زبان برنامهنویسی محاسبات آماری از آزمون علامت استفاده کنیم، کافی است که تابع زیر را به کار ببریم.
مشخص است که تابع به کار رفته همان آزمون دوجملهای است ولی از آنجایی با میزان درصد موفقیت 0.5 منظور شده، مانند آزمون علامت عمل خواهد کرد.
واضح است که در اینجا تعداد موفقیتها است. البته میتوان را به صورت برداری دو ستونی از تعداد موفقیتها و شکستها باشد. از طرفی نیز تعداد نمونهها است. نیز مقدار احتمال برای آزمون دوجملهای است. برای اینکه آزمون علامت اجرا شود، باید مقدار آن را 0.5 در نظر بگیریم. در پارامتر alternative نیز نوع آزمون تعیین میشود. برای انجام آزمون دو طرفه مقدار two.sided و برای آزمون یک طرفه مقدار less یا greater را در نظر خواهیم گرفت. همچنین conf.level نیز سطح اطمینان ۰Confidence level) برای فاصله اطمینان است زیرا خروجی این دستور علاوه بر برآورد احتمال موفقیت یک فاصله اطمینان برای این پارامتر جامعه نیز تولید میکند.
برای مثال اگر بخواهیم آزمون مربوط به مثال ۲ را به صورت یک طرفه اجرا کنیم کافی است از دستور زیر کمک بگیریم.
خروجی چنین دستوری به صورت زیر خواهد بود. مشخص است که p-value همان مقدار احتمال است که در مثال بدست آمد.
همچنین براساس دادهها، برآورد احتمال موفقیت نیز برابر با 0.888889 بدست آمده و یک فاصله اطمینان ۹۵٪ نیز با کران پایین 0.5708645 و کران بالایی 1.00000 ساخته شده است. به این ترتیب باز هم مشخص میشود که فرض صفر رد خواهد شد زیرا فاصله اطمینان شامل مقدار 0.5 نیست.
اگر مطلب بالا برایتان مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- آموزش آزمون آماری و پی مقدار (p-value)
- مجموعه آموزشهای نرمافزارهای آماری
- آموزش آزمون های فرض مربوط به میانگین جامعه نرمال در SPSS
- آزمایش تصادفی، پیشامد و تابع احتمال
- تحلیلها و آزمونهای آماری — مفاهیم و اصطلاحات
^^