آزمون علامت (Sign Test) — به زبان ساده

۲۵۷۹ بازدید
آخرین به‌روزرسانی: ۰۸ خرداد ۱۴۰۲
زمان مطالعه: ۸ دقیقه
آزمون علامت (Sign Test) — به زبان ساده

در حوزه آمار، آزمون‌های آماری از اهمیت خاصی برخوردار هستند. به کمک آزمون‌های آماری می‌توانیم براساس نمونه‌های تصادفی در مورد پارامتر جامعه، دست به قضاوت بزنیم. روش‌های انجام آزمون‌های آماری به دو گروه آزمون‌های پارامتری و آزمون‌های ناپارامتری تقسیم می‌شود. «آزمون علامت» (Sign Test) از گروه آزمون‌های ناپارامتری بوده و برای داده‌های ترتیبی مناسب است.

997696

به منظور آشنایی با روش‌های پارامتری و ناپارامتری بهتر است مطلب آمار پارامتری و ناپارامتری — انتخاب روش های تحلیل را مطالعه کنید. از طرفی برای آشنایی با اصطلاحات مربوط به آزمون‌های آماری خواندن نوشتار آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات مناسب به نظر می‌رسد. همچنین مرور مطلب مقدار احتمال (p-Value) — معیاری ساده برای انجام آزمون فرض آماری نیز خالی از لطف نیست.

آزمون علامت

آزمون علامت، متعلق به گروه روش‌های استنباط آماری ناپارامتری است و برای تشخیص اختلاف بین زوج‌ مشاهدات مناسب است. برای مثال می‌توان وضعیت تغییر وزن افراد را براساس این آزمون مورد تجزیه و تحلیل قرار داد. به این ترتیب آماره آزمون علامت براساس افزایش، کاهش یا ثابت بودن وزن افراد محاسبه می‌شود. فرض کنید وزن افراد قبل از انجام رژیم درمانی در متغیر XX ثبت شده است. وزن همین اشخاص بعد از انجام رژیم درمانی نیز در متغیر YY نگهداری می‌شود. به این ترتیب زوج مرتب (Xi,Yi)(X_i,Y_i) بیانگر یک مشاهده از نمونه تصادفی است. آماره آزمون در این حالت براساس روابط x>y,x=y,xx>y, x=y, x شکل می‌گیرد. هر یک از این حالت‌ها را می‌توان با نماد «--»، «+» یا «۰» نشان داد.

به بیان دیگر اگر متغیرهای XX و YY عددی و از نوع پیوسته باشند، می‌توان آزمون علامت را به صورت یک فرض آماری در نظر گرفت که نشان می‌دهد مقدار میانه اختلاف مربوط به این دو متغیر برابر با صفر است یا خیر. از طرفی از این آزمون برای قضاوت در مورد میانه یک نمونه تصادفی نیز می‌توان استفاده کرد. به این ترتیب می‌توانیم تصمیم بگیریم که آیا میانه اعداد با مقدار مشخصی برابر است یا خیر. برای مثال می‌توانیم برای تعیین اینکه آیا میانه نمرات یک کلاس برابر با ۱۷ است با نمونه‌های تصادفی آزمون فرض را اجرا کنیم.

نکته: همانطور که گفته شد، آماره آزمون علامت براساس روابط بزرگتر یا کوچکتر و یا مساوی شکل می‌گیرد. ولی اگر رابطه بین زوج مشاهدات را بتوان به صورت عددی (مانند آزمون T) نشان داد دقت و توان آزمون بیشتر از توان آزمون علامت خواهد بود.

آزمون علامت از گروه آزمون‌های ناپارامتری محسوب می‌شود در نتیجه احتیاج به اطلاعاتی در مورد توزیع داده‌های مربوط به جامعه آماری، ندارد. به این ترتیب نیازی به نرمال بودن توزیع داده‌ها برای انجام چنین آزمونی وجود ندارد. به همین علت در بسیاری از موارد قابل استفاده بوده ولی متاسفانه توان آزمون نسبت به دیگر آزمون‌های مشابه کوچکتر است. از طرفی از این آزمون برای انجام آزمون‌های یک طرفه و دو طرفه نیز می‌توان استفاده کرد.

تاریخچه

«جان آربوتنات» (John Arbuthnot) در سال ۱۷۱۰ به بررسی تعداد تولدها در شهر لندن از تاریخ 1629 تا 1710 پرداخت. در این دوره به نظر می‌رسید که تعداد پسرهای متولد شده از دختران بیشتر است. او در مقاله‌ای که در آن دوره به چاپ رساند اولین بار واژه «آزمون بامعنایی» (Significance Tests) را به کار برد.

Arbuthnot_John_Kneller

در سال‌های 1710 تا ۱۷۱۳ «نیکولاس برنولی» (Nicholas Bernoulli)  تحلیل‌ها و نتایج آماری او را بررسی کرده و نتیجه گرفت که بیشتر تغییرات موالید در سال مربوط به تولد پسران است که بوسیله توزیع دو جمله‌ای با پارامتر احتمال p=1835p=\frac{18}{35} توصیف می‌شود. به نظر می‌رسد اولین بار در بررسی‌های «برنولی» است که از توزیع دوجمله‌ای برای برازش داده‌های واقعی استفاده شده است. در سال ۱۹۹۹ «کونور» (Conover) و «اسپرنت» (Sprent) به توصیف دست‌آوردهای «آربوتنات» علاقمند شدند و سعی کردند به زبان و بیان آزمون فرض آماری نظریه او را که نشان می‌داد نرخ تولد پسران با دختران یکسان نیست، مورد بررسی قرار دهند.

Bernoulli_Nicolaus

نحوه محاسبه آماره آزمون علامت

به منظور استفاده از آزمون علامت باید زوج‌های نمونه، تصادفی باشند. به این معنی که هر یک از مولفه‌های تشکیل دهنده زوج مرتب (X,Y)(X,Y) باید به صورت تصادفی از جامعه گرفته شده باشند و از طرفی با یکدیگر مرتبط باشند تا مفهوم زوج وجود داشته باشد.

فرض کنید p=P(Y>X)p=P(Y>X) باشد و فرض صفر نیز به صورت H0:p=0.5H_0: p=0.5 در نظر گرفته شود. به این ترتیب به نظر می‌رسد که فرض صفر بیانگر آن است که برای زوج مشاهده xix_i و yiy_i پیشامد بزرگتر بودن مولفه اول از دومی در بیشتر موارد وجود دارد. در نظر بگیرید که یک نمونه nn تایی از زوج مشاهدات به صورت {(x1,y1),(x2,y2),,(xn,yn)}\{(x_1, y_1), (x_2, y_2),\cdots, (x_n, y_n)\} باشند. از این مجموعه، زوج‌هایی که با یکدیگر یکسان هستند را خارج می‌کنیم. در نتیجه ممکن است تعداد زوج‌های نمونه تصادفی به mm تا کاهش پیدا کند. در این حالت اگر WW را تعداد زوج‌هایی در نظر بگیریم که در آن‌ها yixi>0y_i-x_i>0 با توجه به فرض صفر،‌ توزیع WW دوجمله‌ای با پارامتر mm و 0.5 است.

W=i=1mIyixiB(m,0.5)\large W=\sum_{i=1}^m I_{y_i-x_i}\sim B(m,0.5)

واضح است که در اینجا منظور از II‌ تابع نشانگر است، به این معنی که اگر yixiy_i-x_i مثبت باشد، مقدار آن ۱ و اگر yixiy_i-x_i‌ منفی باشد مقدار آن ۰ است. به نظر می‌رسد که به این ترتیب الگو موفقیت و شکست مربوط به آزمایش برنولی ایجاد شده و جمع آن‌ها از توزیع دو جمله‌ای پیروی می‌کند.

نکته: زمانی که مقدار xix_i با yiy_i برابر باشد، می‌گوییم به اصطلاح گره اتفاق افتاده است. در آزمون علامت، نمونه‌هایی که گره‌دار هستند حذف شده و از مابقی نمونه برای انجام آزمون استفاده می‌شود.

plus and minus

به این ترتیب با توجه به توزیع دوجمله‌ای برای WW می‌توان از آزمون دوجمله‌ای نیز برای این حالت استفاده کرد. البته همانطور که می‌دانید برای زمانی که m>30m>30 باشد می‌توان از تقریب توزیع نرمال برای توزیع دوجمله‌ای هم بهره گرفت.

آزمون یک طرفه H1:p<0.5H_1: p <0.5 را می‌توان به کمک مقدار احتمال P(Ww)P(W\geq w) انجام داد. به این ترتیب مشخص می‌شود که مقدارهای XX دارای رتبه بزرگتری نسبت به مقدارهای YY هستند. به همین ترتیب برای آزمون یک طرفه H1:p>0.5H_1: p >0.5 نیز کافی است که مقدار احتمال را برمبنای P(Ww)P(W\leq w') در نظر گرفت و نشان داد که مقدارهای YY دارای مرتبه بزرگتری نسبت به XX هستند. در حالتی که آزمون دو طرفه باشد، مقدار احتمال نیز برابر با «دو برابر کوچکترین مقدار احتمال مربوط به آزمون‌های یک طرفه» خواهد بود.

مثال 1

به منظور بررسی تناسب پاهای چپ نوعی گوزن اطلاعاتی از طول پای چپ عقب و جلو ۱۰ گوزن ثبت شده است. می‌خواهیم آزمون کنیم که آیا این طول‌ها با یکدیگر از لحاظ آماری اختلاف معنی‌داری دارند یا خیر. این اطلاعات مطابق جدول ثبت شده‌اند.

شماره نمونهطول پای چپ-جلوطول پای چپ-عقباختلاف
1142138+
2140136+
3144147-
4144139+
5142143-
6146141+
7149143+
8150145+
9142136+
10148146+

در اینجا فرض صفر، به صورت یکسان بودن طول پاهای جلویی و عقبی در نظر گرفته شده است. در فرض مقابل نیز وجود اختلاف در طول پاها لحاظ شده در نتیجه آزمون به صورت دو طرفه خواهد بود. بنابراین باید آماره آزمون WW یا خیلی بزرگ (بزرگتر یا مساوی ۸) یا خیلی کوچک (کمتر از ۲) باشد تا فرض صفر رد شود.

واضح است که n=m=10n=m=10 به این معنی که هیچ زوجی دارای مقدار برابر در XX و YY نیستند. تعداد علامت‌های مثبت (+) 8 و تعداد علامت‌های منفی (-) نیز 2 است. اگر فرض صفر صحیح باشد، با توجه به توزیع دو جمله‌ای برای اختلاف‌ها با پارامترهای 10 و 0.5 انتظار می‌رود که 5 علامت‌ (+) وجود داشته باشد. به این ترتیب باید مقدارهای زیر را محاسبه کنیم.

P(W8p=0.5)+P(W2p=0.5)=P(W=8p=0.5)+P(W=9p=0.5)+P(W=10p=0.5)+P(W=0p=0.5)+P(W=1p=0.5)+P(W=2p=0.5)=0.04395+0.0077+0.00098+0.00098+0.00977+0.04395=0.109375P(W \geq 8| p=0.5)+P(W \leq 2|p=0.5)= P(W=8|p=0.5)+P(W=9|p=0.5)+\\P(W=10|p=0.5)+P(W=0|p=0.5)+P(W=1|p=0.5)+P(W=2|p=0.5)=\\ 0.04395+0.0077+0.00098+0.00098+0.00977+0.04395=0.109375

بنابراین با توجه به سطح آزمون ۵٪ (0.05) این نمونه، دلیل بر رد فرض صفر (یکسان بودن طول پاها) ارائه نمی‌دهد.

مثال ۲

در یک فروشگاه دو محصول A و B وجود دارند. فروشنده می‌خواهد بسنجد که تمایل مشتریان به کدام محصول بیشتر است. از ده خریدار درخواست می‌کند که نظر خود را در مورد ترجیح خرید از بین دو محصول A و B اعلام کنند. در اینجا فرض صفر یکسان بودن احتمال انتخاب هر یک از محصولات است، در حالیکه می‌توانیم فرض مقابل را ترجیح محصول B بر A در نظر بگیریم. بنابراین اگر p را احتمال انتخاب محصول B بر A در نظر بگیریم، خواهیم داشت.

H0:p=0.5H1:p>0.5\large H_0 :p=0.5\\ \large H_1: p >0.5

براساس مشاهدات و نظرسنجی از این نمونه ۱۰ تایی از مشتریان، اطلاعات زیر بدست آمده است:

  • تعداد علامت‌های +  = ۸ (این به معنی ترجیح محصول B بر محصول A توسط ۸ نفر است.)
  • تعداد علامت‌هایی - = 1 (این به معنی ترجیح محصول A بر محصول B‌ توسط ۱ نفر است.)
  • تعداد  گره‌ها = ۱ (این به معنی عدم ترجیح یکی بر دیگری توسط ۱ نفر است.)

plus and minus sign

از آنجایی که تعدا گره‌ها باید از تعداد مشاهدات کم شود، در اینجا m=9 در نظر گرفته می‌شود. احتمال اینکه تعداد مثبت‌ها زیاد (بزرگتر از ۸ باشد) چقدر است؟ اگر فرض صفر صحیح باشد، خواهیم داشت:

P(W8p=0.5)=P(W=8p=0.5)+P(W=9p=0.5)=0.0176+0.002=0.0195\large P(W \geq 8|p=0.5)= P(W=8|p=0.5)+P(W=9|p=0.5)=0.0176+0.002=0.0195

با توجه به در نظر گرفتن سطح آزمون α=0.05\alpha=0.05 فرض صفر رد می‌شود. بنابراین به نظر می‌رسد که محصول B نسبت به A‌ دارای تمایل یا ترجیح بیشتری در بین مشتریان ‍است.

مثال ۳

طول عمر بیمارانی که دچار سرطان هستند مورد بررسی قرار گرفته است. از بین پرونده‌های این بیماران ۱۰ نمونه تصادفی انتخاب شده و طول هفته‌هایی که از زمان مثبت بودن آزمایش تا مرگشان طی شده استخراج شده است. یک نفر نیز با توجه به این که مقدار +۳۶۲ برایش ثبت شده تایید شده که تا پایان دوره بررسی‌ها زنده مانده است. اطلاعات به صورت زیر ثبت و مورد بررسی قرار گرفته‌اند.

49,58,75,110,112,132,151,276,281,362+49,58,75,110,112,132,151,276,281,362+

قرار است با توجه به این داده‌ها، قضاوت کنیم که میانه طول عمر این گونه بیماران بیشتر یا کمتر از ۲۰۰ هفته است. به این ترتیب به نظر می‌رسد که فرض صفر و فرض مقابل به صورت زیر نوشته می‌شوند.

{H0:Median=200H1:Median200\large \begin{cases}H_0: & Median = 200\\ H_1: & Median \neq 200\end{cases}

با توجه به خصوصیات آزمون علامت مشخص است که افرادی که بیش از ۲۰۰ هفته عمر کرده‌اند با علامت + و کسانی که کمتر از ۲۰۰ هفته زندگی کرده‌اند نیز با علامت - متمایز می‌شوند. این کار درست به مانند روشی است که برای سنجش میزان اختلاف بین زوج‌ها به کار بردیم. اگر فرض صفر صحیح باشد، نیمی از بیماران باید طول عمری بیشتر از ۲۰۰ یا کمتر از آن داشته باشند.

براساس داده‌های جمع‌آوری شده تعداد علامت‌های (+) برابر با ۷ و تعداد علامت‌های (-) نیز ۳ است. تعداد مثبت‌ها (+) با در نظر گرفتن صحیح بودن فرض صفر دارای توزیع دوجمله‌ای با پارامترهای n=10 و p=0.5 است. بنابراین مقدار احتمال مشاهده بیش از ۷ یا کمتر از ۳ بیمار معیار انجام آزمون است.

احتمالات مربوطه برای هر مقدار از تعداد بیماران با توجه به توزیع دو جمله‌ای با پارامتر n=10 و p=0.5 در جدول زیر آمده است.

k012345678910
Pr0.00100.00980.04390.11720.20510.24610.20510.11720.04390.00980.0010

به این ترتیب احتمال مورد نظر باید از نقاط 0,1,2,3,7,8,9,10 تشکیل شود. بنابراین مجموع احتمالات برای این نقاط برابر است با:

 0.0010+0.0098+0.0439+0.1172+0.1172+0.0439+0.0098+0.0010=0.3438\large  0.0010+0.0098+0.0439+0.1172+0.1172+0.0439+0.0098+0.0010=0.3438

که اگر آزمون را در سطح 0.05 در نظر بگیریم، این نمونه دلیلی برای رد فرض صفر ندارد. در نتیجه به نظر می‌رسد که میانه طول عمر این بیماران برابر با ۲۰۰ هفته خواهد بود. البته ممکن است با توجه به افزایش حجم نمونه بتوان آزمون پرتوان‌تری داشت و به نتیجه بهتر و دقیق‌تری رسید.

نرم‌افزارهای اجرای آزمون علامت

از آنجایی که آزمون علامت را می‌توان حالت خاصی از آزمون دوجمله‌ای در نظر گرفت در بیشتر نرم‌افزارهای محاسبات آماری امکان اجرای آن وجود دارد. برای مثال اگر لازم باشد در زبان برنامه‌نویسی محاسبات آماری RR از آزمون علامت استفاده کنیم، کافی است که تابع زیر را به کار ببریم.

مشخص است که تابع به کار رفته همان آزمون دوجمله‌ای است ولی از آنجایی با میزان درصد موفقیت 0.5 منظور شده، مانند آزمون علامت عمل خواهد کرد.

1binom.test(x, n, p = 0.5, alternative = c("two.sided", "less", "greater"), conf.level = 0.95)

واضح است که در اینجا xx تعداد موفقیت‌ها است. البته می‌توان xx را به صورت برداری دو ستونی از تعداد موفقیت‌ها و شکست‌ها باشد. از طرفی nn نیز تعداد نمونه‌ها است. pp نیز مقدار احتمال برای آزمون دوجمله‌ای است. برای اینکه آزمون علامت اجرا شود، باید مقدار آن را 0.5 در نظر بگیریم. در پارامتر alternative نیز نوع آزمون تعیین می‌شود. برای انجام آزمون دو طرفه مقدار two.sided و برای آزمون یک طرفه مقدار less یا greater را در نظر خواهیم گرفت. همچنین conf.level نیز سطح اطمینان ۰Confidence level) برای فاصله اطمینان است زیرا خروجی این دستور علاوه بر برآورد احتمال موفقیت یک فاصله اطمینان برای این پارامتر جامعه نیز تولید می‌کند.

برای مثال اگر بخواهیم آزمون مربوط به مثال ۲ را به صورت یک طرفه اجرا کنیم کافی است از دستور زیر کمک بگیریم.

1binom.test(x=8, n=9, p=0.5, alternative="greater")

خروجی چنین دستوری به صورت زیر خواهد بود. مشخص است که p-value‌ همان مقدار احتمال است که در مثال بدست آمد.

1	Exact binomial test
2
3data:  8 and 9
4number of successes = 8, number of trials = 9, p-value = 0.01953
5alternative hypothesis: true probability of success is greater than 0.5
695 percent confidence interval:
7 0.5708645 1.0000000
8sample estimates:
9probability of success 
10             0.8888889

همچنین براساس داده‌ها، برآورد احتمال موفقیت نیز برابر با 0.888889 بدست آمده و یک فاصله اطمینان ۹۵٪ نیز با کران پایین 0.5708645 و کران بالایی 1.00000 ساخته شده است. به این ترتیب باز هم مشخص می‌شود که فرض صفر رد خواهد شد زیرا فاصله اطمینان شامل مقدار 0.5 نیست.

اگر مطلب بالا برایتان مفید بوده، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

 

بر اساس رای ۱۳ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *