آزمون تی طبقه ای در SAS و R — راهنمای کابردی

۲۸۵ بازدید

آخرین به‌روزرسانی: ۲۳ خرداد ۱۴۰۲

زمان مطالعه: ۱۰ دقیقه

آزمون تی طبقه ای در SAS و R — راهنمای کابردی

آزمون تی طبقه ای یک روش تجزیه و تحلیل است که اغلب نادیده گرفته می شود در حالیکه یک آزمون مقایسه قوی را ارائه می‌دهد. امروزه، با ظهور قدرت محاسباتی بیشتر و سرعت پردازش سریعتر، آزمون‌های دیگری به جای آزمون تی طبقه ای مورد استفاده قرار می‌گیرد برای مثال «تحلیل کوواریانس» (ANCOVA) یکی از روش‌های جایگزین برای آزمون t طبقه ای است، که خروجی مشابه نیز دارد.

فهرست مطالب این نوشته

آزمون تی طبقه ای

پیش‌فرض‌های آزمون تی طبقه ای

خلاصه و جمع‌بندی

در این نوشتار سعی داریم با تکیه بر روند انجام عملیات آزمون t طبقه ای در SAS، دقت محاسباتی و خصوصیات آزمون تی طبقه‌ ای را بازگو کرده و نتایج حاصل را با «انکوا» (ANCOVA) یا تحلیل کوواریانس مقایسه کنیم. به این منظور بهتر است، نوشتارهای دیگر مجله فرادرس مانند تحلیل کوواریانس ANCOVA در SPSS — راهنمای کاربردی و آزمون تی (T Test) در R --- راهنمای کاربردی را مطالعه کنید. همچنین خواندن مطالب آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات و آزمون فرض میانگین جامعه در آمار — به زبان ساده نیز خالی از لطف نیست.

آزمون تی طبقه ای

آزمون تی برای مقایسه میانگین یک جامعه نرمال با مقدار ثابت یا انجام آزمون فرض آماری برای اختلاف میانگین در دو جامعه نرمال مورد استفاده قرار می‌گیرد. البته فرض بر این است که واریانس هر دو جامعه برابر ولی نامشخص است. هر چند اصلاحی نیز برای زمانی که واریانس دو جامعه اختلاف داشته باشند، مطرح شده و آماره آزمون تی براساس برآورد دیگری از واریانس صورت می‌گیرد. شرط استفاده از آزمون تی و آماره آن، مستقل بودن هر دو جامعه و تصادفی بودن نمونه‌ها است.

فیلم آموزش آمار و احتمال مهندسی در فرادرس

کلیک کنید

اما رویکرد دیگری که برای اجرای آزمون تی وجود دارد، تهیه نمونه‌ها براساس یک طرح نمونه‌گیری طبقه‌ای است. در این صورت نمونه‌ها مستقل از دو جامعه، طی یک «نمونه‌گیری طبقه‌ای» (Stratified) جمع‌آوری شده‌اند. در این صورت برای محاسبه میانگین و واریانس آماره آزمون تی، باید تغییراتی صورت گیرد. البته توجه داشته باشید که آماره حاصل باز هم دارای توزیع تی بوده و برای تصمیم نسبت به رد یا تایید فرض صفر به جدول‌های این توزیع مراجعه می‌شود.

از آنجایی که طرح نمونه‌گیری طبقه‌ای به کار رفته و ممکن است رابطه‌ای بین طبقه‌ها وجود داشته باشد، در این آزمون یک متغیر همبسته با طبقه به صورت مزاحم وجود دارد که بوسیله محاسبات صورت گرفته، سعی داریم اثر آن را از بین ببریم. به همین علت گاهی آزمون تی طبقه ای را مشابه با تحلیل و «آنالیز کوواریانس» (ANCOVA) یا Analysis of Covariance می‌دانند.

آماره آزمون تی طبقه ای

آماره آزمون مقایسه میانگین بین دو جامعه (مثلا گروه کنترل و گروه آزمایش) طبق طرح نمونه‌گیری طبقه‌ای به صورت زیر است.

$$ \large T = \dfrac{ \sum_{k = 1}^K w_k d_k }{ \left( \sum w^2_k \widehat{ \sigma}^2_k \right)^{1/2}} $$

آماره آزمون t طبقه ‌ای

در صورتی که K = 2 باشد، تعداد طبقه‌ها ۲ در نظر گرفته می‌شود. البته توجه داشته باشید که در آزمون تی، همیشه تعداد گروه‌ها یا تیمارها برابر با ۲ است. با تغییر طبقه‌ها به مقدار K = 4 تعداد میانگین و پارامترهای دیگر آزمون تی طبقه‌ ای برابر با ۸ خواهد بود. به این ترتیب چهار طبقه و دو گروه مورد بررسی قرار می‌گیرند.

این آماره آزمون به صورت مجانبی دارای توزیع t بوده و با توجه به توزیع آن برای انجام آزمون فرض آماری و همچنین ایجاد فاصله اطمینان به کار می‌رود. البته با افزایش تعداد نمونه‌ها می‌توان توزیع آماره را با توزیع نرمال استاندارد تقریب زد و فاصله اطمینان را محاسبه نمود.

در ادامه پارامترهای محاسباتی برای آماره T‌معرفی و شیوه محاسبه آن‌ها یادآوری شده است.

$$ \large w_k = \dfrac{n_{1k} n_{0k}}{\sum_{k = 1}^K \left( \dfrac{n_{1k} n_{0k} }{n_{1k} + n_{0k}} \right) } $$

محاسبه وزن‌ها برای هر طبقه

$$ \large T_k = \dfrac{d_k}{ \widehat{\sigma}_k}
= \dfrac{\left( \overline{x}_{1k} - \overline{x}_{0k} \right) }{ \left( \dfrac{n_{1k} + n_{0k}}{n_{1k} n_{0k}} \right)^{1/2} s_k} $$

محاسبه آماره t برای هر طبقه

از طرفی برآورد واریانس آمیخته $$s_k$$ نیز به شکل زیر انجام خواهد شد.

$$ \large s^2_k = \left( \dfrac{n_{1k} + n_{0k}}{n_{1k}n_{0k}} \right) \dfrac{(n_{1k} - 1) s^2_{1k} + (n_{0k}-1) s^2_{0k}}{n_{1k} + n_{0k} - 2} $$

در رابطه‌های بالا، پارامترها به صورت زیر هستند.

$$n_{1k}$$: تعداد مشاهدات در گروه آزمون یا ۱ و طبقه kام
$$n_{0k}$$: تعداد مشاهدات در گروه کنترل یا گروه صفر و طبقه kام
$$\overline{x}_{1k}$$: میانگین مشاهدات در گروه آزمون یا ۱ و طبقه kام

$$ \large \overline{x}_{1k} = \dfrac{1}{n_{1k}} \sum_{i = 1}^{n_{1k}} x_{1ik} $$

$$\overline{x}_{0k}$$: میانگین مشاهدات در گروه آزمون کنترل یا 0 و طبقه kام

$$ \large \overline{x}_{0k} = \dfrac{1}{n_{0k}} \sum_{i = 1}^{n_{0k}} x_{0ik} $$

$$s^2_{1k}$$: واریانس مشاهدات در گروه آزمون یا ۱ و طبقه kام
$$s^2_{0k}$$: واریانس مشاهدات در گروه آزمون کنترل یا 0 و طبقه kام
$$s^2_k$$: واریانس آمیخته مشاهدات در طبقه kام

به این ترتیب و با استفاده از وزن‌ها و میانگین و واریانس طبقه‌ها، اثر تیمار به صورت زیر محاسبه می‌شود.

$$ \large \text{ Treatment Effect } d_w =\sum _{k = 1}^K w_k d_k $$

همچنین فاصله اطمینان برای $$d_w$$ نیز به شکل زیر خواهد بود.

$$ \large \text{ 95 percent Confidence interval for d_w : } d_w \pm Z_{0.025} \sqrt{\sum_{k = 1}^K w^2_k \widehat{\sigma}^2_k } $$

پیاده سازی آزمون تی طبقه ای در SAS

طبق فرمول و رابطه‌های گفته شده در قسمت قبل، در ادامه به کدنویسی و ایجاد یک ماکرو در SAS برای انجام محاسبات مربوط به آزمون تی طبقه ای می‌پردازیم. تابع یا ماکرو مورد نظر با نام (STRAT_T) برای استخراج آزمون t طبقه ای مطابق زیر است. فرض بر این است که متغیرهای مورد نظر، قبلاً به یک مجموعه داده واحد به نام STRATA تبدیل شده‌اند.

فیلم آموزش تجزیه و تحلیل اطلاعات با نرم افزار SAS ساس در فرادرس

کلیک کنید

1/*************************************************************************
2** Macro name: STRAT_T.sas **
3** **
4** Variables : &DATAIN - full dataset name (including libname) **
5** &DATAOUT - full output dataset name (including libname) **
6** &OUTFILE - full output area (including libname) **
7** &VARINT - variable of interest **
8** &TREAT - treatment arm (numeric) **
9** &STRATA - strata variables (derived from binary covars) **
10** &ALPHA - confidence level (default=95) **
11** &DIRECT - "direction" of test (default=1) **
12** **
13** Function : Provides stratified t-test and formalised output **
14*************************************************************************/
15%MACRO STRAT_T (datain=,
16 dataout=,
17 outfile=,
18 varint=,
19 treat=,
20 strata=,
21 alpha=,
22 direct=);
23options nofmterr nocenter mprint mlogic symbolgen;
24** Set defaults **;
25%if %length(&ALPHA)<0 %then %let ALPHA=95;
26%if %length(&DIRECT)<0 %then %let DIRECT=1;
27proc sort data=&datain out=strtdata;
28 by &strata &treat;
29run;
30data strtdat2;
31 set strtdata;
32 if &strata ne . and &varint ne . and &treat ne . ;
33 strata=&strata;
34 treat=&treat;
35run;
36proc sql;
37 create table n as select count(&varint) as n,
38 mean(&varint) as mean, strata, treat from strtdat2
39 group by strata, treat;
40 select max(strata) into : stratnum from strtdat2;
41quit;
42run;
43
44 %do str=1 %to &STRATNUM;
45 %do trt=1 %to 2;
46 data _null_;
47 set n;
48 if strata=&str and treat=&trt then do;
49 call symput("n&trt&str",n);
50 call symput("mean&trt&str",mean);
51 end;
52 run;
53 %end;
54 %end;

در بخش بعدی وزن‌ها برای آزمون تی طبقه ای مورد محاسبه قرار گرفته و میانگین برای هر یک از گروه‌ها و طبقه‌ها ساخته می‌شود.

1** Set up weights **;
2data wt1;
3 %do str=1 %to &STRATNUM;
4 %do trt=1 %to 2;
5 n&trt&str=&&n&trt&str;
6 mean&trt&str=&&mean&trt&str;
7 %end;
8 %end;
9 %do str=1 %to &STRATNUM;
10 num&str=(&&n1&str*&&n2&str) / (&&n1&str+&&n2&str);
11 diff&str=&&mean1&str - &&mean2&str;
12 %end;
13 denom = num1;
14 %do str=2 %to &STRATNUM;
15 denom = denom+num&str;
16 %end;
17 %do str=1 %to &STRATNUM;
18 wt&str = num&str / denom;
19 %end;
20 est = wt1 * diff1;
21 %do str=2 %to &STRATNUM;
22 est = est + (wt&str*diff&str);
23 %end;
24run;
25** Set up GLM **;
26proc sort data=strtdat2 out=glm;
27 by strata;
28run;
29ods output overallanova=anova;
30proc glm data=glm;
31 class treat;
32 model &varint=treat;
33 by strata;
34quit;
35run;
36ods output close;
37data error(drop=source);
38 set anova;
39 where upcase(source)='ERROR';
40 var=ms;
41run;
42data _null_;
43 set error;
44 %do str=1 %to &STRATNUM;
45 if strata=&str then call symput("error&str",var);
46 %end;
47run;

همچنین یک جدول آنالیز واریانس-کوواریانس نیز براساس طبقه و گروه‌ها ساخته شده و نتایج هر دو نوع تحلیل، در قسمت بعدی با هم مقایسه شده‌اند.

1** Bring together **;
2data &DATAOUT;
3 set wt1;
4 %do str=1 %to &STRATNUM;
5 error&str=&&error&str;
6 var&str=&&error&str/num&str;
7 %end;
8 varval=(var1*(wt1*wt1));
9 %do str=2 %to &STRATNUM;
10 varval=varval + (var&str*(wt&str*wt&str));
11 %end;
12 stderr=sqrt(varval);
13 tval=1 - ((1-(&ALPHA/100))/2);
14 low =est-(probit(tval)*stderr);
15 high=est+(probit(tval)*stderr);
16 t=est/stderr;
17 %if &DIRECT=1 %then %do; p=probnorm(t); %end;
18 %if &DIRECT^=1 %then %do; p=1-probnorm(t); %end;
19run;
20** Sort and present data in table format **;
21data table;
22 set &DATAOUT;
23 keep meanse pval ci;
24 meanse=put(est,5.2)||' ('||put(stderr,6.3)||')';
25 pval =put(p,6.4);
26 ci ='('||put(low,6.2)||', '||put(high,6.2)||')';
27run;
28proc transpose data=table out=table2;
29 var meanse pval ci;
30run;
31data table3 (drop=_name_ rename=(col1=outvar));
32 length subord $20.;
33 set table2;
34 order=_n_;
35 if order=1 then subord="Mean (SE) ";
36 if order=2 then subord="p-Value ";
37 if order=3 then subord="&ALPHA % CI";
38run;
39proc sort data=table3 out=finalt;
40 by order;
41run;
42** Produce output using PROC REPORT **;
43proc printto file="&outfile" new;
44run;
45title "Stratified t-test output";
46proc report data=finalt nowindows spacing=0
47 missing headline headskip split='*' ls=160 ps=60;
48 column order subord ('Treatment Comparison' outvar);
49 define order / order order=internal noprint;
50 define subord / display flow left width=40 'Statistic';
51 define outvar / display center width=40 ' ';
52run;
53proc printto;
54run;
55%MEND;

نتایج حاصل از اجرای کد

به کمک شبیه‌سازی و ایجاد یک مجموعه داده، خروجی به صورت زیر در خواهد آمد. خروجی قسمت برنامه PROC REPORT به صورت زیر است.

1Stratified t-test output
2Treatment Comparison
3Statistic
4--------------------------------------------------------------------------------------
5Mean (SE) -14.1 ( 3.891)
6p-Value 0.0001
795 % CI (-21.75, -6.50)

همچنین جدول خروجی مربوط به وزن‌ها و میانگین تیمار و طبقه‌ها، همچنین واریانس‌ها به صورت زیر است. از طرفی مقایسه «واریانس ساده اختلاف میانگین‌» (Variance of Difference) و «واریانس وزنی اختلاف میانگین» (Variance of weighted Difference) برای برآوردگر میانگین اختلاف در جدول زیر دیده می‌شود.

Variance of weighted Difference	Variance of Difference	Weighted Treatment Difference	Treatment Difference	Weights	TreatB (N)	TreatA (N)	STRATA
18.553323	74.677123	-4.524638	-18.21167	0.24845	8	10	1
12.363871	49.150202	-4.164596	-16.55556	0.25155	9	9	2
13.507772	54.368783	-1.976812	-7.956667	0.24845	8	10	3
16.169965	64.2806	-13.79526	-13.75926	0.25155	9	9	4

محدودیت‌ها و مقایسه‌ها

آنچه در اجرای آزمون تی مهم محسوب می‌شود، نرمال بودن جامعه آماری است. آنچه به عنوان آماره آزمون و توزیع آن شناختیم با فرض نرمال بودن جامعه آماری تعیین شده بود. در نتیجه سنجش و آزمون نرمال بودن داده‌ها نیز از اهمیت زیادی برخوردار است که در مطالب دیگر فرادرس به آن‌ها اشاره خواهیم داشت.

با استفاده از برخی داده‌های شبیه سازی شده، می‌توان تخمین‌ها و خطاهای استاندارد را با توجه به تعداد مشاهدات رسم و مورد تحلیل قرار داد. به منظور تحلیل نتایج از آزمون t طبقه بندی شده در برابر روش ANCOVA، در کد قبلی از شبیه‌سازی و تابع RANUNI به عنوان منبع تولید چندین متغیر تصادفی استفاده شده است. در جدول زیر برآورد و خطاهای استاندارد به ترتیب با استفاده از آزمون t طبقه ای و ANCOVA در ادامه دیده می‌شود.

ANCOVA		Stratified t-test		N
SE	ESTIMATE	SE	ESTIMATE	N
3.834	-14.1272	3.891434	-14.1272	40
6.157	-8.8959	6.221243	-8.8959	80
4.072	-5.60174	4.093138	-5.60174	160
2.386	-3.52742	2.391905	-3.52742	320
1.33	-2.22121	1.332119	-2.22121	640
0.723	-1.39869	0.723148	-1.39869	1280
0.386	-0.88076	0.386529	-0.88076	2560
0.205	-0.55461	0.204532	-0.55461	5120
0.107	-0.34924	0.107491	-0.34924	10240
0.056	-0.21992	0.056222	-0.21992	20480
0.029	-0.13848	0.029307	-0.13848	40960

از مقایسه مقادیر برآورد یا تخمین‌ها (Estimate) می‌توان فهمید که هیچ تفاوتی بین این دو رویکرد (t test stratified) و آنکوا (ANOVA) وجود ندارد. با این حال، با نگاهی به خطاهای استاندارد، تفاوت کمی وجود دارد که در آن به ازای N <10000 نیز این اختلاف از بین می‌رود زیرا در این حالت «قانون اعداد بزرگ» (LLN) یا «قضیه حد مرکزی» (CLT) صدق می‌کند.

پیاده سازی آزمون تی طبقه ای در R

کدی که در ادامه مشاهده می‌کنید، نحوه پیاده‌سازی آزمون تی طبقه ای را در زبان برنامه نویسی R، نشان می‌دهد. در ابتدا کتابخانه یا بسته‌های plyr و dplyr بارگذاری شده‌اند تا بتوان از تابع ddply به منظور تفکیک داده‌ها به طبقه‌ها، استفاده کرد.

فیلم آموزش آزمون های فرض میانگین جامعه در اس پی اس اس SPSS در فرادرس

کلیک کنید

سپس انجام محاسبات طبق فرمول‌های گفته شده، صورت گرفته و نتیجه به عنوان خروجی ظاهر می‌گردد. البته وجود طبقه strata در خلال برنامه با تابع is.null مورد بررسی قرار می‌گیرد. اگر طبقه در مجموعه داده وجود نداشته باشد، آزمون تی معمولی با جایگزینی treatment با strata صورت خواهد گرفت. در انتها نیز با یک مثال، داده‌هایی به صورت تصادفی تولید شده و تابع را برای آن مجموعه فراخوانی کرده‌ایم.

1library(plyr)
2library(dplyr)
3
4#########################################
5# Function Structure Input: Data,  Output: Test Statistics
6#########################################
7test_strat = function (data) {
8  #########################################
9  #                  Check if data is suitable or not                 #
10  #########################################
11  
12  if (is.matrix(data)) return(cat("Input is not a dataframe, or does not have the correct column names."))
13  
14  #########################################
15  #                  Check existence of strata in data set         #
16  #                 if not then execute treatment as strata       #
17  #########################################
18  
19  if (is.null(data$strata))
20  {   flag = FALSE
21  data$strata=data$treatment 
22  } else {   flag = TRUE }
23  
24  
25  #########################################
26  #                  Splitting Data to treatments and Stratas   #
27  #                                                                                    #
28  #########################################
29  
30  splitted=ddply(data,.(treatment,strata) ,summarize, mean = mean(x),var=var(x),n=length(x))
31  xbar1=splitted[splitted$treatment==1,3]
32  xvar1=splitted[splitted$treatment==1,4]
33  n1=splitted[splitted$treatment==1,5]
34  
35  #########################################
36  #                  Compute xbars and n's and Variances     #
37  #                                                                                   #
38  #########################################
39  
40  
41  xbar2=splitted[splitted$treatment==2,3]
42  xvar2=splitted[splitted$treatment==2,4]
43  n2=splitted[splitted$treatment==2,5]
44  
45  varpooled= (n1+n2)/(n1*n2)*((n1-1)*xvar1+(n2-1)*xvar2)/(n1+n2-2)
46  w=(n1*n2)/(sum((n1*n2)/(n1+n2)))
47  
48  
49  #########################################
50  #                  Execute t statistics                                     #
51  #                                                                                   #
52  #########################################
53  
54  t =sum(w*(xbar1-xbar2))/(sqrt(sum(w^2*varpooled)))
55  
56  return(cat("t_stat" ,"Stratified" ,"\n" ,round(t,4) , flag))
57  
58}
59#########################################
60#                  Compute function for an example           #
61#                                                                                   #
62#########################################
63set.seed(2020)
64strat <- data.frame(x = c(rnorm(200, 35), rnorm(200, 55), rnorm(200, 75)),
65                    treatment = rep(1:2, 300), strata = c(rep(1, 200), rep(2, 200), rep(3, 200))
66)
67# With strata
68test_strat(data = strat)
69

محاسباتی که در این بخش انجام شده است، دقیقا مطابق با فرمول‌های ارائه شده است. فقط توجه داشته باشید که در کد گفته شده، در صورتی که مجموعه داده شامل طبقه نباشد، گروه‌ها (Treatment) را جایگزین طبقه (Strata) کرده و همان محاسبات را دنبال می‌کنیم. این کار باعث کاهش اندازه کد و در عین حال عمومیت بخشیدن به آزمون تی می‌شود. به این ترتیب هم در حالت طبقه ای و هم بدون طبقه می‌توان از کد یکسانی در R استفاده کرده و نتایج مناسب را بدست آورد.

نکته: مجموعه داده‌ای که به تابع test_strat داده می‌شود باید از نوع dataframe باشد. در غیر اینصورت برنامه با پیغام Input is not a dataframe, or does not have the correct column names کاربر را مطلع می‌سازد.

به مثال‌های زیر توجه کنید. در اولین حالت (With strata) با در نظر گرفتن طبقه‌ها طبق کد گفته شده، خروجی محاسبه شده است.

1# With strata
2test_strat(data = strat)
3t_stat stratified
41 1.041 TRUE
5
6# Without strata
7no_strat <- select(strat, -strata)
8test_strat(data = no_strat)
9t_stat stratified
101 0.067 FALSE
11
12# You may use a different message
13wrong_format <- as.matrix(strat)
14test_strat(data = wrong_format)
15[1] "Input is not a dataframe, or does not have the correct column names."

در بخش دوم با حذف strata از مجموعه داده با دستور select، آزمون تی مستقل صورت گرفته است. در ستون stratified نیز مقدار FALSE نشانگر بی طبقه بودن آزمون تی است. در انتها نیز با تبدیل مجموعه داده به یک ماتریس، تابع test_strat، پیغام خطا را نشان داده است.

پیش‌فرض‌های آزمون تی طبقه ای

ما در این متن روش آزمون تی طبقه ای را بوسیله یک ماکرو کامل به زبان برنامه‌نویسی SAS و همچنین کدهایی به زبان R، ارائه کرده و نتایج را از تجزیه و تحلیل دریافت و یک جدول اساسی برای نمایش خروجی ایجاد کردیم. البته به یاد داشته باشید قبل از به کارگیری آزمون، باید داده‌های مورد تجزیه و تحلیل را بررسی کنیم تا از نرمال بودن آن‌ها اطمینان حاصل کنیم.

فیلم مجموعه آموزش آمار و احتمالات – از دروس دانشگاهی تا کاربردی در فرادرس

کلیک کنید

در روشهای آمار پارامتری فرض بر این است که داده‌ها دارای توزیع شناخته شده و معینی هستند. در بیشتر موارد در آمار کلاسیک این توزیع برای داده‌ها، توزیع گاوسی یا نرمال در نظر گرفته می‌شود. ولی اگر توزیع این داده‌ها گاوسی یا نرمال نباشد، پیش‌فرض‌های مربوط به آزمون‌ها و تحلیل‌های آمار پارامتری (Parametric Methods) و کلاسیک نقض شده و باید از روش‌های آماری «غیرپارامتری» یا «ناپارامتری» (Non Parametric Methods) استفاده کرد. ولی سوال در اینجا این است که چگونه از نرمال بودن داده‌ها مطلع شویم؟

خوشبختانه روش‌های زیادی به منظور سنجش و آزمودن نرمال بودن داده (Normality Test) وجود دارد که می‌توان از آنها استفاده کرد. البته از آنجایی که در این بین از آزمون آماری و مقدار احتمال (P-value) صحبت به میان می‌آید بهتر است در مورد هر یک از این اصطلاحات در نوشتارهای آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات و مقدار احتمال (p-Value) — معیاری ساده برای انجام آزمون فرض آماری اطلاعاتی کسب کنید تا مفاهیم و روش‌های نرمالیتی و سنجش توزیع داده‌ها را بهتر درک کنید. البته در اینجا از معرفی این تکنیک‌ها صرف نظر کرده و خواننده را به لینک‌ها ارائه شده، ارجاع می‌دهیم.

خلاصه و جمع‌بندی

در این نوشتار با مفهوم آزمون تی طبقه ای آشنا شده و مزایای استفاده از آن نسبت به دیگر آزمون‌های میانگین برای دو جامعه مستقل را بازگو کردیم. البته شاید بتوان آزمون تحلیل کوواریانس را به شکلی مشابه آزمون t طبقه ای در نظر گرفت ولی از آنجا که بار محاسباتی در آزمون و تجزیه و تحلیل کوواریانس بسیار بیشتر از آزمون t طبقه ای است در مواردی که دسترسی به دستگاه‌ها یا نرم‌افزارهای محاسبات آماری وجود ندارد، آزمون تی طبقه ای کاربردی و در دسترس است. به همین منظور آماره آزمون و نحوه اجرای آن را در نرم‌افزار محاسباتی SAS و R مرور کرده و برنامه مورد نیاز برای اجرای آن را در این متن فرا گرفتیم.

بر اساس رای ۰ نفر

آیا این مطلب برای شما مفید بود؟

اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

ثبت نظر

منابع:

lexjansen مجله فرادرس

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.