هرچند معیارهای مرکزی و پراکندگی می‌توانند خصوصیات جامعه آماری را نشان دهند ولی استفاده از جدول فراوانی نیز کمک بسیاری به شناخت جامعه آماری می‌کند، به خصوص در زمانی که داده‌ها کیفی هستند.

فیلم آموزش جدول فراوانی برای داده‌های کیفی و کمی — مثال‌های کاربردی (+ دانلود فیلم آموزش رایگان)

دانلود ویدیو

شاید بتوان جدول فراوانی را به نوعی نشان‌دهنده پراکندگی برای داده‌ها نیز در نظر گرفت. از جدول فراوانی حتی برای استخراج خصوصیات متغیرهای کمی و کیفی مانند میانگین، میانه و نما می‌توان استفاده کرد. بنابراین اگر مقدارهای یک متغیر کیفی یا کمی (که به صورت طبقه‌ای درآمده)، موجود باشد، سعی داریم، با استفاده از جدول فراوانی پاسخ بعضی از پرسش‌ها را پیدا کنیم.

خصوصیات جدول فراوانی

جدول فراوانی از چند سطر و ستون تشکیل شده است. هر سطر نشانگر خصوصیات یک طبقه یا رده است. همچنین ویژگی‌های مربوط به هر سطر نیز در ستون‌ها نام‌گذاری شده‌اند.

در زیر نمونه یک جدول فراوانی مشاهده می‌شود.

نام رده یا حدود رده (طبقات) فراوانی- f فراوانی نسبی- r فراوانی تجمعی- F فراوانی نسبی-تجمعی- R
جمع

نکته: ممکن است ستونی به عنوان شماره ردیف نیز در اول جدول قرار داشته باشد. این ستون به ارجاع آسان به سطرهای جدول فراوانی کمک می‌کند. مثلا اگر گفته شود که نما در رده سوم جدول فراوانی قرار دارد، به این معنی است که باید در سطر سوم به دنبال آن بگردیم.

ستون‌های این جدول به ترتیب از راست به چپ در ادامه معرفی می‌شوند.

نام رده یا حدود رده (طبقات)

براساس مقدارهای متغیر کیفی یا حدود طبقاتی که متغیر کمی دارد، مقدارهای ستون نام رده یا حدود رده ساخته می‌شود. برای مثال اگر گروه خون را در نظر بگیریم،‌ نام رده برای هر سطر، یکی از گروه‌های خونی مثل A, AB, B یا O است. یا اگر مدرک تحصیلی باید در جدول فراوانی گنجانده شود، ستون نام رده می‌تواند اسامی مدرک‌های تحصیلی باشد. مثل جدول زیر

نام مدرک تحصیلی زیر دیپلم دیپلم کاردانی کارشناسی کارشناسی ارشد دکتری پسا دکتری

نکته: گاهی به جای ذکر مقدار متنی برای متغیرهای کیفی از کدگذاری عددی استفاده می‌شود. این کدها به جای نام رده نیز می‌توانند در هر سطر به کار روند.

ولی اگر جدول فراوانی مربوط به متغیر کمی است، رده یا طبقاتی که براساس مقدارهای این متغیر ساخته شده،‌ در این ستون قرار می‌گیرند. برای مثال رده‌ها، می‌توانند برای حدود سنی، به صورت جدول زیر باشد:

حدود سنی 0-1 2-3 5-10 11-15 16-30 31-55 56-75 76 به بالا

فراوانی

به تعداد تکرارهای هر مقدار از ستون رده یا حدود رده، «فراوانی» (Frequency) می‌گویند. این مقدار در ستون فراوانی قرار می‌گیرد. باید در حالتی که حدود رده وجود دارد دقت کرد که یک مشاهده در دو رده شمارش نشود. به این ترتیب مجموع ستون فراوانی برای همه رده‌ها برابر با تعداد نمونه یا مشاهدات (n) خواهد بود. فراوانی مربوط به رده $$i$$ام را با $$f_i$$ نشان می‌دهیم.

فراوانی نسبی

اگر فراوانی هر رده را به جمع فراوانی‌ها تقسیم کنیم، «فراوانی نسبی» (Relative Frequency) حاصل می‌شود. البته می‌توان مقدار این ستون را به صورت درصدی نیز نمایش داد. برای این کار کافی است حاصل تقسیم را در ۱۰۰ ضرب کنیم و حاصل را با علامت ٪ نشان دهیم. نماد مربوط به فراوانی نسبی رده $$i$$ام، به صورت $$r_i$$ است.

اگر تعداد کل فراوانی‌ها در جدول فراوانی را با n نشان دهیم، برای نمایش شیوه محاسبه فراوانی نسبی می‌توان از رابطه ریاضی زیر کمک گرفت:

$$r_i=\dfrac{f_i}{n}$$

در نتیجه با ضرب طرفین این تساوی، می‌توان مقدار فراوانی را بر اساس فراوانی نسبی نیز محاسبه کرد.

$$f_i=r_i\times n$$

جمع ستون فراوانی نسبی برابر با ۱ و در حالتی که مقدارهای آن به صورت درصدی باشند برابر با ۱۰۰٪ خواهد بود.

فراوانی تجمعی

برای محاسبه «فراوانی تجمعی» (Cumulative Frequency) برای هر رده، کافی است فراوانی آن رده را با فراوانی رده‌های قبلی جمع کرد. فراوانی تجمعی رده iام را با $$F_i$$ نشان می‌دهیم. برای مثال اگر برای رده سوم به دنبال فراوانی تجمعی هستیم،‌ کافی است فراوانی رده سوم را با فراوانی رده دوم و اول جمع کنیم.

برای محاسبه فراوانی تجمعی رده iام می‌توان رابطه زیر را به بیان ریاضی نوشت:

$$F_i=\sum_{k=1}^if_k$$

به منظور افزایش سرعت در انجام محاسبه فراوانی تجمعی برای یک رده، کافی است فراوانی تجمعی رده قبلی را با فراوانی رده مورد نظر جمع کرد. مثلا برای محاسبه فراوانی تجمعی رده سوم کافی است فراوانی تجمعی رده دوم را با مقدار فراوانی رده سوم جمع کنیم. از آنجایی که مجموع فراوانی‌ها تا رده دوم در ستون فراوانی تجمعی رده دوم قرار دارد، کافی است آن را با فراوانی رده سوم جمع کنیم تا فراوانی تجمعی رده سوم بدست آید.

پس می‌توان فرمول زیر را برای آن نوشت:

$$F_i=F_{i-1}+f_i$$

در نتیجه رابطه‌ زیر بین فراوانی و فراوانی تجمعی هر رده با رده قبلی بوجود می‌آید:

$$f_i=F_i-F_{i-1}$$

فراوانی نسبی-تجمعی

ستون «فراوانی نسبی-تجمعی» (Cumulative Relative Frequency) درست به مانند ستون فراوانی تجمعی، از حاصل جمع فراوانی نسبی رده‌های قبلی و رده انتخابی ایجاد می‌شود. برای مثال به منظور محاسبه فراوانی نسبی-تجمعی رده سوم کافی است فراوانی نسبی رده اول،‌ دوم و سوم را با هم جمع کنیم. یا مجموع مقدار فراوانی نسبی-تجمعی رده دوم را با مقدار فراوانی نسبی رده سوم بدست آوریم.

در نتیجه همان روابطی که بین فراوانی تجمعی و فراوانی وجود داشت، برای فراوانی نسبی-تجمعی و فراوانی نسبی نیز وجود دارد.

$$R_i=R_{i-1}+r_i$$ , $$r_i=R_i-R_{i-1}$$

در انتهای ستون فراوانی تجمعی و ستون فراوانی نسبی-تجمعی، جمع قرار نمی‌گیرد. دیگر آنکه همیشه فراوانی تجمعی رده اول با فراوانی رده اول برابر است و فراوانی نسبی-تجمعی برای رده اول نیز با فراوانی نسبی رده اول یکسان است.

نکته: اگر جدول فراوانی مربوط به متغیر کیفی از نوع اسمی باشد،‌ معمولا از ستون‌های فراوانی تجمعی و فراوانی نسبی-تجمعی استفاده نمی‌کنند.

مثال 1- جدول فراوانی داده کیفی (اسمی)

گروه خون برای ۱۰ نفر از دانشجویان به صورت AB,A,A,B,B,O,B,O,O,O ثبت شده است. جدول فراوانی برای این افراد براساس گروه خون به صورت زیر است.

شماره ردیف رده (گروه خونی) فراوانی فراوانی نسبی
1 A 2 $$\tfrac{2}{10}=0.2$$
2 B ۳ $$\tfrac{3}{10}=0.3$$
۳ O 4 $$\tfrac{4}{10}=0.4$$
۴ AB 1 $$\tfrac{1}{10}=0.1$$
جمع 10 1

برطبق این جدول می‌توان به سوالات زیر پاسخ داد:

۱- چند درصد از دانشجویان دارای گروه خونی O‌ هستند؟ ۴۰٪

۲- چه تعداد دارای گروه خونی AB هستند؟ ۱ نفر

۳- اگر یک نمونه ۲۰۰ نفری داشتیم،‌ انتظار دارید چه تعدادی دارای گروه خونی B‌ باشند؟ 0.3×200=60 نفر

۴- نما (بیشترین تکرار) برای گروه‌های خونی مربوط به چه گروهی است؟ گروه خونی O دارای فراوانی ۴ است و بیشترین فراوانی را دارد. پس نما یا مد محسوب می‌شود.

نکته: با توجه به این که گروه خونی یک متغیر کیفی از نوع اسمی است،‌ ترتیبی برای مقدارهای آن نمی‌توان در نظر گرفت. پس ممکن است جای ردیف‌ها را در جدول تغییر داد بدون آنکه در اطلاعاتی که جدول به ما می‌دهد تغییری بوجود آید.

گاهی براساس جدول فراوانی، نمودار فراوانی یا بافت‌نگار نیز رسم می‌کنند.

بافت‌نگار مربوط به داده‌های گروه‌ خونی

مثال 2- جدول فراوانی داده کیفی (ترتیبی)

مدرک تحصیلی ۲۰ کارمند یک شرکت به صورت زیر جمع‌آوری شده است.

1 2 3 4 5 6 7 8 9 10
کاردانی کاردانی کاردانی کاردانی کارشناسی ارشد دیپلم کاردانی دیپلم کارشناسی ارشد کاردانی
11 12 13 14 15 16 17 18 19 20
دیپلم دکتری کارشناسی دکتری کارشناسی کاردانی کارشناسی کاردانی کارشناسی کارشناسی ارشد

با توجه به اینکه این داده‌ها از نوع ترتیبی هستند، همه ستون‌های جدول فراوانی برای آن باید نمایش داده شود. جدول فراوانی برای این داده‌ها در ادامه قابل رویت است.

شماره ردیف رده (مدرک تحصیلی) فراوانی فراوانی نسبی فراوانی تجمعی فراوانی نسبی-تجمعی
۱ دیپلم 3 0.15 3 0.15
۲ کاردانی 8 0.40 11 0.55
۳ کارشناسی 4 0.20 15 0.75
۴ کارشناسی ارشد 3 0.15 18 0.95
۵ دکتری 2 0.1 20 1
جمع 20 1

در زیر بافت‌نگار مربوط به مدارک کارمندان شرکت برحسب جدول فراوانی ترسیم شده است.

با استفاده از این جدول می‌توان به سوالاتی به شکل زیر پاسخ داد:

۱- چند نفر دارای مدرک کارشناسی هستند؟ ۴ نفر

۲- چند نفر از کارمندان مدرک زیر کارشناسی ارشد دارند؟ 18 نفر

۳- چند درصد از کارمندان بالای دیپلم هستند؟ $$1-0.15=0.85$$ پس 85٪ از کارمندان مدرک تحصیلی بالاتر از دیپلم دارند.

۴- چند نفر از کارمندان مدرک کاردانی تا کارشناسی ارشد دارند؟ با دو روش می‌توان به این سوال پاسخ داد: الف- فراوانی کاردانی+فراوانی کارشناسی+فراوانی کارشناسی ارشد=8+4+3=15. ب- تفاضل فراوانی تجمعی کارشناسی ارشد با دیپلم که به صورت 3-18=15 محاسبه می‌شود.

۵- بیشترین فراوانی (نما) مربوط به کدام مدرک تحصیلی است؟ با توجه به حداکثر فراوانی (مقدار ۸) که مربوط به مدرک کاردانی است، مشخص می‌شود که نما برای مدارک تحصیلی، کاردانی است.

۶- میانه برای مدرک‌های تحصیلی کدام است؟ با توجه به اینکه در ستون فراوانی نسبی-تجمعی اولین رده‌ای که مقدارش بزرگتر یا مساوی با ۵۰٪ است مربوط به مدرک کاردانی می‌شود، نتیجه می‌گیریم که مدرک کاردانی میانه مدرک کارمندان شرکت است.

نکته: فراوانی تجمعی رده آخر همیشه برابر با n و فراوانی تجمعی نسبی رده آخر نیز همیشه برابر با ۱ خواهد بود.

برای تشکیل جدول فراوانی برای داده‌های کمی، باید آن‌ها را طبقه‌بندی کرد. ممکن است از قبل، داده‌ها به صورت طبقه‌بندی شده ارائه شوند. در این حالت کافی است طبقه‌ها را در جدول فراوانی قرار داده و محاسبات مربوط به جدول فراوانی را انجام دهیم.

مثال 3- جدول فراوانی داده گسسته

در این مثال با اطلاعات مربوط به تعداد فرزندان ۵۰ خانوار روستایی سروکار داریم و باید برای آن‌ها جدول فراوانی تشکیل دهیم. این اطلاعات به صورت زیر است.

0 0 1 1 1 2 2 0 0 2
3 4 4 3 4 4 3 4 4 3
4 3 5 6 5 6 5 6 5 6
7 7 5 6 7 7 5 6 5 6
5 6 5 6 5 6 5 5 5 5

با توجه به مقدارهای مختلف برای تعداد فرزندان مشخص است که جدول فراوانی باید دارای ۸ رده باشد. ولی با استفاده از طبقه‌بندی و ایجاد دسته‌های مختلف می‌توان جدول فراوانی با رده‌های کمتر ایجاد کرد. جدول فراوانی برای تعداد فرزندان ۵۰ خانوار روستایی با ۵ رده به صورت زیر خواهد بود.

شماره ردیف حدود رده فراوانی فراوانی نسبی فراوانی تجمعی فراوانی نسبی-تجمعی
۱ 0 4 4 ۸٪
2 1-2 6 12٪ 10 20٪
3 3-4 12 24٪ 22 44٪
4 5-6 24 48٪ 46 92٪
5 ۷ و بیشتر 4 50 100٪
جمع 50 100٪

در زیر بافت‌نگار مربوط به تعداد فرزندان خانوارها برحسب جدول فراوانی ترسیم شده است.
با استفاده از این جدول می‌توان به سوالاتی مانند زیر پاسخ داد:

۱- تعداد خانوارهایی که دارای ۵ یا ۶ فرزند هستند؟ ۲۴ خانوار.

۲- درصد خانوارهایی که دارای ۳ یا ۴ فرزند هستند؟ ۲۴٪.

۳- تعداد خانوارهایی که کمتر از ۵ فرزند دارند؟ ۲۲ خانوار.

۴- درصد خانوارهایی با بیش از ۵ فرزند؟ با دو روش می‌توان به سوال پاسخ داد: الف-براساس تفاضل فراوانی نسبی-تجمعی ۴۴٪-۱۰۰٪=56٪ (منظور از ۱۰۰٪ همان فراوانی نسبی-تجمعی رده آخر است). ب- براساس مجموع فراوانی‌های نسبی 48٪+8٪=56٪.

۵- اگر روستایی دیگر با ۱۰۰ خانوار، دارای توزیع فرزندان به مانند همین روستا باشد، انتظار دارید خانوارهای با ۵ یا ۶ فرزند چه تعداد باشند؟ 48٪×100= ۴۸ خانوار.

6- کدام رده دارای بیشترین فراوانی است؟ با توجه به نمودار و جدول فراوانی مشخص است که خانوارهایی با ۵ یا ۶ فرزند،‌ نما هستند.

۷- کدام رده شامل میانه تعداد فرزندان است؟ از آنجایی که اولین رده در ستون فراوانی نسبی-تجمعی که مقدارش بیشتر یا مساوی ۵۰٪ است مربوط به رده خانوارهایی با تعداد فرزند ۵ یا ۶ است، میانه رده چهارم خواهد بود.

۸- به طور متوسط تعداد فرزندان هر خانوار در این روستا چقدر است؟ اگر برای هر رده، وسط حدود رده را به عنوان نماینده‌ آن رده با علامت $$x_i$$ در نظر بگیریم و ستون فراوانی نسبی را به عنوان وزن هر نماینده رده محسوب کنیم، میانگین را می‌توان به صورت زیر محاسبه کرد:

 $$\overline{X}=\sum r_ix_i=0.08\times 0 + 0.12\times 1.5+0.24\times 3.5+0.48\times 5.5+0.08\times 7=4.22$$

در نتیجه هر خانوار در این روستا به طور متوسط حدود ۴ فرزند دارد.

مثال 4- جدول فراوانی داده کمی (پیوسته)

وزن یک نمونه ۵۰ تایی از قوطی‌های رب گوجه در یک فایل اطلاعاتی با قالب اکسل ثبت شده است. فایل اکسل حاوی این اطلاعات را می‌توانید از اینجا دریافت کنید. از آنجایی که این وزن‌ها با دقت گرم ثبت شده‌اند، برای طبقه‌بندی آن‌ها مراحل زیر را طی می‌کنیم.

۱- ابتدا دامنه تغییرات را برای داده‌ها محاسبه می‌کنیم ولی از آنجایی که داده‌ها با دقت ۱ گرم ثبت شده‌اند ممکن است مقداری که برای بزرگترین وزن به ما داده شده (یعنی 510.0) کمی بیشتر بوده که در اثر گرد شدن به این مقدار 510.0 رسیده است.

همچنین کمترین مقدار که برابر با 491 گرم است ممکن است در اثر گرد کردن مقداری مثلا 490.6 بدست آمده باشد. بنابراین در چنین حالتی اگر p برابر میزان دقت اندازه‌گیری باشد، مقدار $$\frac{1}{2}$$ به بزرگترین مقدار اضافه و $$\frac{1}{2}$$ از کوچکترین مقدار کسر می‌کنیم و سپس دامنه تغییرات را  بدست می‌آوریم. این مقدار برآورد بهتری برای دامنه تغییرات است.

به این ترتیب خواهیم داشت:

$$R=Max+\frac{p}{2}-(Min-\frac{p}{2})=510+0.5-(491-0.5)=20$$

حال اگر قرار باشد وزن قوطی‌ها را براساس ۵ رده، طبقه‌بندی کنیم،‌ طول رده برابر خواهد بود با $$\frac{20}{5}=4$$ گرم. پس برای مثال کران‌های مربوط به رده اول به صورت $$(490.5-494.5]$$ و برای رده دوم نیز $$(494.5-498.5]$$ خواهد بود.

۲- براساس حدود هر طبقه،‌ داده‌های مربوطه را شمارش می‌کنیم و در ستون فراوانی قرار می‌دهیم.

۳- محاسبات برای ستون‌های دیگر را برمبنای ستون فراوانی تکمیل می‌کنیم.

۴ برای چک کردن صحت انجام محاسبات، جمع ستونی فراوانی را با اندازه نمونه (۵۰) و جمع ستون فراوانی نسبی را با ۱ یا ۱۰۰٪ مقایسه می‌کنیم.

حال براساس این طبقه‌بندی، جدول فراوانی را تشکیل می‌دهیم.

شماره ردیف حدود رده یا طبقه فراوانی فراوانی نسبی فراوانی تجمعی فراوانی نسبی-تجمعی
1 $$[490.5,494.5)$$ 10 20٪ 10 20٪
2 $$[494.5,498.5)$$ 8 16٪ 18 36٪
۳ $$[498.5,502.5)$$ 10 20٪ 28 56٪
۴ $$[502.5,506.5)$$ 13 26٪ 41 82٪
۵ $$[506.5,510.5)$$ 9 18٪ 50 100٪
جمع 50 100٪

در زیر بافت‌نگار مربوط به وزن قوطی‌های گوجه فرنگی برحسب جدول فراوانی ترسیم شده است.

با استفاده از این جدول می‌توان به سوالات زیر پاسخ داد:

۱- چند قوطی وزنی کمتر از 502.5 گرم دارند؟ 28 قوطی

۲- چند درصد قوطی‌ها وزنی بین 498.5 تا 502.5 دارند؟ 20٪

3- چند درصد قوطی‌ها از 502.5 گرم وزنی بیشتری دارند؟ به دو روش می‌توان پاسخ داد. یا فراوانی نسبی-تجمعی 56٪-100٪=44٪ یا با فراوانی نسبی 18٪+26٪=44٪

4- چه حدود وزنی بیشترین فراوانی را دارد؟ با توجه به حداکثر میزان فراوانی که برابر با ۱۳ است متوجه می‌شویم که بیشترین فراوانی در حدود وزنی 502.5 تا 506.5 گرم است.

5- نما برای وزن قوطی‌های رب گوجه چند گرم است؟ با توجه به نمودار یا ستون فراوانی مشخص می‌شود که رده 4 نما محسوب می‌شود، یا می‌توان گفت که نما در بین دو مقدار 502.5 تا 506.5 قرار دارد.

6- میانه برای وزن قوطی‌های رب گوجه چند گرم است؟ با توجه به ستون فراوانی نسبی-تجمعی مشخص است که اولین رده‌ای که مقدار فراوانی نسبی-تجمعی آن بزرگتر یا مساوی با ۵۰٪ است،‌ رده سوم است پس میانه در این رده قرار دارد. یا می‌توان گفت که میانه در بین دو مقدار 498.5 تا 502.5 قرار دارد.

7- میانگین و انحراف معیار وزن قوطی‌های رب گوجه چقدر است؟ به منظور محاسبه این پارامترها بهتر است از یک جدول کمکی بهره گرفت. این جدول در ادامه دیده می‌شود. برای محاسبه ستون نماینده رده از وسط حدود رده استفاده شده است. مجموع حاصل ضرب فراوانی نسبی در مقدار نماینده رده نیز میانگین وزن را محاسبه می‌کند که برابر با 500.74 گرم است.

برای محاسبه انحراف معیار هم تفاضل مقدار نماینده رده‌ها از میانگین محاسبه شده و به توان ۲ رسیده است. مجموع حاصلضرب این مقدارها در فراوانی نسبی، واریانس را نشان می‌دهد. در این حالت مقدار واریانس برابر با 30.99 گرم مربع است. با جذر گرفتن از واریانس، انحراف معیار پیدا می‌شود. پس مقدار انحراف معیار بر اساس جدول فراوانی برابر با 5.57 گرم خواهد بود.

حدود رده $$x_i$$ $$f_i$$ $$r_i$$ $$r_ix_i$$ $$(x_i-\overline{x})^2$$ $$r_i(x_i-\overline{x})^2$$
$$[490.5,494.5)$$ 492.5 10 0.2 0.2×492.5=98.5 $$(492.5-500.74)^2=67.90$$ 13.58
$$[494.5,498.5)$$ 496.5 8 0.16 0.16×496.5=79.44 $$(496.5-500.74)^2=17.98$$ 2.88
$$[498.5,502.5)$$ 500.5 10 0.2 0.2×500.5=100.1 $$(500.5-500.74)^2=0.06$$ 0.01
$$[502.5,506.5)$$ 504.5 13 0.26 0.26×504.5=131.17 $$(504.5-500.74)^2=14.14$$ 3.68
$$[506.5,510.5)$$ 508.5 9 0.18 0.18×508.5=91.53 $$(508.5-500.74)^2=60.22$$ 10.84
جمع 50 1 500.74 160.3 30.99

اگر مطلب بالا برای شما مفید بوده است، احتمالاً آموزش‌هایی که در ادامه آمده‌اند نیز برایتان کاربردی خواهند بود.

^^

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

بر اساس رای 62 نفر

آیا این مطلب برای شما مفید بود؟

3 نظر در “جدول فراوانی برای داده‌های کیفی و کمی — مثال‌های کاربردی (+ دانلود فیلم آموزش رایگان)

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *