آمار , داده کاوی 1646 بازدید

یکی از شیوه‌های خلاصه‌سازی داده‌ها در محاسبات آماری، جمع‌بندی (Aggregate) است که به عنوان یکی از گام‌های داده‌کاوی در بخش پیش‌پردازش داده‌ها به کار می‌رود. برای مثال میانگین‌گیری یا محاسبه حاصل جمع یک متغیر، جمع‌بندی محسوب می‌شود. البته می‌توان این جمع‌بندی را به تفکیک یک یا چند متغیر دیگر نیز انجام داد. برای مثال محاسبه میانگین حقوق افراد برحسب محل خدمتشان نوعی جمع‌بندی است. در این نوشتار با جمع بندی داده در SPSS آشنا خواهیم شد و براساس مثال‌هایی، این موضوع را عمیق‌تر مورد بررسی قرار خواهیم داد.

برای آشنایی بیشتر با محاسبات آماری در نسخه‌های جدید نرم‌افزار SPSS بهتر است مطلب امکانات جدید SPSS نسخه ۲۵ که باید آن‌ها را بدانید را مطالعه کنید. همچنین اگر می‌خواهید با محیط SPSS و نحوه به کارگیری پنجره‌های آن بیشتر آشنا شوید خواندن نوشتار پنجره ویرایشگر داده (Data Editor) در SPSS — راهنمای کاربردی نیز خالی از لطف نیست.

جمع بندی داده در SPSS

در تهیه گزارشات آماری، اغلب با مسئله جمع‌بندی مواجه هستیم زیرا هدف از تهیه گزارشات مالی و مدیریت یا عملکردی، ارائه اطلاعات فشرده شده از همه داده‌ها است. این فشرده‌سازی باید به شکلی صورت گیرد که از گزارشات ایجاد شده، بیشترین اطلاعات را کسب کرد. جمع‌بندی داده‌ها یکی از روش‌هایی است که اختصاص به انجام این عمل دارد. از طرفی ممکن است بخواهیم برای بعضی از گروه‌ها یا دسته‌ها، جمع‌بندی را انجام دهیم. از آنجایی که SPSS به عنوان یکی از نرم‌افزارهای کاربردی مناسب برای انجام تحلیل آماری است، در این نوشتار نحوه جمع بندی داده در SPSS‌ را فرا خواهیم گرفت. برای روشن شدن موضوع نیز با استفاده از یک منبع داده و پرسش‌هایی که می‌توانند به عنوان گزارشات در نظر گرفته شوند، مثال‌هایی مطرح خواهیم کرد.

برای مثال فرض کنید شما یک فروشگاه بزرگ دارید که به فروش چند کالای خاص اختصاص داده‌اید. در این فروشگاه یک نوع کالا را از دو تولید کننده متفاوت عرضه می‌کنید. ممکن است لازم باشد مجموع فروش این کالا را به تفکیک شرکت تولید کننده محاسبه کنید تا با سلیقه مشتریانتان بیشتر آشنا شوید. این عمل نیز نوعی جمع‌بندی روی میزان فروش کالا است که براساس نام تولید کننده،‌ تفکیک شده است.

از طرفی، شیفت کاری نیز در فروشگاه، وجود دارد و می‌خواهید کارایی هر شیفت را نیز بسنجید. همچنین ممکن است بین شیفت کاری و شرکت تولید کننده نیز رابطه برقرار باشد. به این معنی که مشتریان صبح‌ها به محصول مثلا نوع یک بیشتر تمایل دارند و در شیفت شب، فروش محصول نوع دو بیشتر است. براساس نتایج محاسبات به کمک جمع‌بندی روی داده‌ها، این اطلاعات و گزارشات را می‌توان بدست آورد.

به این ترتیب ممکن است شاخص‌های حاصل از جمع‌بندی به تنهایی یا براساس یک یا چند متغیر تفکیکی (Categorical Variable)، محاسبه و به کار گرفته شوند. در ادامه با نحوه انجام این گونه محاسبات در SPSS آشنا خواهیم شد و به کمک دستورات متنوعی، عملیات جمع بندی داده در SPSS را اجرا خواهیم کرد.

ابتدا با یک مجموعه داده در SPSS آشنا می‌شویم که در ادامه کار، از آن در قالب مثال‌هایی استفاده خواهیم کرد. این مجموعه داده، دارای چهار متغیر و شامل ۱۲ مشاهده بوده که هر سطر مربوط به مقادیر اندازه‌گیری شده در یک ماه است. این متغیرها به ترتیب میزان سفارش (Purchase)، میزان فروش (Sale)، نوع کالا (Type) و شیفت کاری (Group) هستند. متغیر اول و دوم، از نوع مقیاس (Scale) و کمّی هستند و متغیرهای سوم و چهارم نیز از نوع اسمی (Nominal) محسوب می‌شوند. متغیر نوع کالا دارای دو سطح (نوع یک و نوع دو)‌ بوده و متغیر شیفت کاری نیز دارای سه سطح (شیفت صبح، عصر و شب) است. واضح است که در اغلب موارد از متغیرهای اسمی (کیفی) برای طبقه‌بندی کردن مجموعه داده، استفاده می‌شود و برای جمع‌بندی از متغیرهای مقیاس (کمی) کمک می‌گیریم. به منظور راحتی در اجرای عملیاتی که در این نوشتار به آن‌ها اشاره کرده‌ایم، فایل اطلاعاتی این مجموعه داده با نام aggregate.sav را می‌توانید از اینجا با قالب فشرده (Zip) دریافت کنید.

تصویر ۱ این مجموعه داده را نشان داده و در تصویر ۲ نیز نحوه تعریف این متغیرها در این فایل داده، دیده می‌شود.

dataset data editor
تصویر ۱: مجموعه داده در پنجره Data View
dataset variable view
تصویر ۲: تعریف مجموعه داده در پنجره Variable View

در تصویر ۲، برچسب هر یک از متغیرها در ستون Label مشخص و همچنین برچسب مقادیر نیز در ستون Values برای متغیرهای type‌ و group تعیین شده است.

فرض کنید قرار است به پرسش‌های زیر در رابطه با مجموعه داده مطرح شده، پاسخ دهیم.

  1. میانگین و انحراف معیار میزان فروش (Sale) چقدر است؟
  2. در چند ماه از ماه‌های سال، فروش کالا از میانگین فروش سالانه کمتر بوده است؟
  3. جمع فروش و میزان سفارش کالا به تفکیک نوع کالا، چقدر است؟
  4. حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به چه میزان است؟
  5. حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به تفکیک شیفت کاری چه میزان است؟

در ادامه به هر یک از این پرسش‌ها با دستورات مختلفی از SPSS، پاسخ خواهیم داد و ابتدا از دستور Aggregate کمک می‌گیریم.

جمع بندی داده در SPSS با دستور Aggregate

یکی از روش‌های محاسبات برمبنای جمع بندی در SPSS استفاده از دستور Aggregate است. بعضی از شاخص‌های آماری مهم مانند میانگین،‌ میانه و انحراف معیار به همراه چندک‌ها (چارک، دهک یا صدک) توسط این دستور قابل محاسبه هستند. به منظور دسترسی به این دستور، کافی است از فهرست Data دستور Aggregate را اجرا کنید. دقت داشته باشید که خروجی این دستور یک یا چند متغیر جدید است که مقادیر حاصل از جمع‌بندی را در خود جای می‌دهند. در تصویر ۳، برخی از این شاخص‌ها دیده می‌شوند. جدول‌های ۱ تا ۳ نیز به معرفی عملکرد توابعی که توسط دستور Aggregate قابل محاسبه هستند، پرداخته است.

ابتدا بهتر است با پنجره دستور Aggregate بیشتر آشنا شویم.

پارامترها و تنظیمات دستور Aggregate

در تصویر زیر پنجره جمع‌بندی (Aggregate) دیده می‌شود. همانطور که در دیگر پنجره‌های SPSS نیز دیده می‌شود، کادر سمت چپ، مربوط به اسامی متغیرهایی است که می‌توانیم در این تحلیل از آن‌ها استفاده کنیم. در ادامه قسمت‌های مختلف این پنجره معرفی شده‌اند.

  • کادر Break Variables، محل قرارگیری متغیرهایی است که باعث طبقه‌بندی یا دسته‌بندی مشاهدات مجموعه داده می‌شوند. برای مثال متغیرهای نوع کالا یا شیفت کاری می‌توانند در این کادر قرار گیرند تا به این وسیله امکان جمع‌بندی روی میزان سفارش یا مبلغ فروش به تفکیک آن‌ها صورت گیرد.
  • در بخش Aggregate Variables و کادر (Summaries of Variables(s، متغیرهایی که برای جمع‌بندی لازم هستند، قرار می‌گیرند. اغلب این متغیرها از نوع کمی هستند البته می‌توانید متغیرهای کیفی مثلا از نوع اسمی (Nominal) یا ترتیبی (Ordinal) را نیز در آن قرار دهید ولی دیگر انتظار نداشته باشید که میانگین یا انحراف معیار برای آن‌ها معنی دار باشد. در این گونه مواقع بهتر است شمارش مشاهدات یا درصد‌گیری را انجام دهید.

Aggregate Data dialog 0

با استفاده از دکمه Function، نوع محاسبه‌ای که در جمع‌بندی به کار می‌رود انتخاب می‌شود.

تصویر ۳: توابع قابل استفاده در دستور Aggregate

این محاسبات برای متغیرهای کمی در قسمت Summary Statistics ظاهر شده است. جدول زیر این گزینه‌ها را معرفی کرده است.

جدول ۱: توابع دستور Aggregate برای داده‌های کمی (مقیاس-Scale)

نام تابع نوع محاسبه
Mean میانگین
Median میانه
Sum مجموع
Standard Deviation انحراف استاندارد

همچنین برای متغیرهای ترتیبی یا کمی از لیست Specific Values نیز می‌توانید استفاده کنید. ضمناً برای متغیرهای اسمی، بهتر است شمارش مشاهدات که در قسمت Number of cases قرار گرفته‌اند را انتخاب کنید. در جدول ۲ و ۳ گزینه‌های مربوطه، مشخص شده‌اند.

جدول ۲: توابع دستور Aggregate برای داده‌های ترتیبی و کمی (مقیاس-Scale)

نام مقدار
First اولین مقدار
Last آخرین مقدار
Minimum کوچکترین مقدار
Maximum بزرگترین مقدار

اگر بوسیله دستور Weight Cases از فهرست Data، مشاهدات را وزن‌دار کرده‌اید، گزینه‌های قسمت Number of cases ممکن است خروجی‌های متفاوتی ظاهر کنند.

جدول ۳: توابع دستور Aggregate برای داده‌های اسمی، ترتیبی و کمی (مقیاس-Scale)

نام شرح
Weighted استفاده از متغیر وزن‌دهی هنگام شمارش مشاهدات
Weighted missing استفاده از متغیر وزن‌دهی و نمایش مشاهدات با مقادیر گمشده
Unweighted بدون استفاده از متغیر وزن‌دهی و شمارش مشاهدات طبق جدول اطلاعاتی
Unweighted missing بدون استفاده از متغیر وزن‌دهی و شمارش همه مشاهدات حتی با مقدار گمشده طبق جدول اطلاعاتی

از طرفی در قسمت Percentage, Fractions, Counts می‌توانید، مشاهدات را شمارش (Counts) کرده یا نسبتی (Fraction) از آن‌ها را به عنوان یک متغیر جدید محاسبه کنید. حتی درصد خاصی از آن‌ها را (مثلا درصد مشاهداتی که مقدار فروش آن‌ها بیشتر از ۱۵۰ است) را به کمک Percentages تحت عنوان یک متغیر جدید ظاهر کنید.

با انتخاب دکمه Name and Label پنجره‌ای مانند تصویر زیر ظاهر شده که در آن می‌توانید برای متغیرهای جدید که توسط جمع‌بندی ایجاد می‌کنید نام یا برچسب تعیین کنید.

در تصویر زیر، تنظیماتی از پنجره Aggregate را می‌بینید که مربوط به نحوه ذخیره سازی نتایج اجرای جمع‌بندی است.

Aggregate Data dialog 1

  • گزینه …Add aggregate variable باعث می‌شود که نتیجه جمع‌بندی به عنوان متغیرهایی به مجموعه داده فعال (active dataset) اضافه شود.
  • با انتخاب گزینه …Create a new dataset، متغیرهای نتیجه جمع‌بندی، در یک مجموعه داده جدید ثبت می‌شود. نام این مجموعه داده باید در قسمت Dataset name مشخص شود.
  • اگر گزینه …Write a new انتخاب شود، نتیجه جمع‌بندی در یک فایل اطلاعاتی جدید ثبت می‌شود.
  • در قسمت Options for Very Large Datasets می‌توانید گزینه‌هایی که برای کار با مجموعه داده بزرگ است را انتخاب یا تغییر دهید. اگر مجموعه داده براساس متغیرهایی طبقه‌ای مرتب شده است گزینه اول را انتخاب کنید. ولی اگر می‌خواهید به محاسبات خود سرعت بیشتری بدهید بهتر است با انتخاب Sort file before aggregating، مجموعه داده را برحسب متغیرهای طبقه‌ای مرتب کنید.

با فشردن دکمه Continue به پنجره اولیه باز خواهید گشت. بعد از همه این تنظیمات، با زدن دکمه OK، متغیر حاصل از جمع‌بندی در پنجره Data Editor‌ و در برگه Data View‌ قابل مشاهده است. حال سوالاتی که برای مجموعه داده aggregate.sav مطرح شد را پاسخ می‌دهیم.

سوال ۱: میانگین و انحراف معیار میزان فروش (Sale) چقدر است؟

Aggregate Data dialog q11

پاسخ سوال ۱: همانطور که دیده می‌شود، با قرار دادن متغیر فروش (Sale) و انتخاب تابع MEAN در پنجره Function، نوع محاسبات مشخص شده است. برای نمایش خروجی نیز از یک مجموعه داده جدید به نام mean استفاده شده است. اگر بخواهیم انحراف استاندارد را هم ثبت کنیم کافی است در پنجره Function نوع محاسبه را Standard deviation انتخاب کرده و عملیات را انجام دهیم.

سوال ۲: در چند ماه از ماه‌های سال، فروش کالا از میانگین فروش سالانه کمتر بوده است؟

پاسخ سوال ۲: با توجه به پاسخ سوال ۱، مشخص است که میانگین فروش سالانه برابر است با 146٫67‌. در نتیجه کافی است برای متغیر فروش (Sale) در پنجره Function تنظیم را به صورت زیر انجام دهیم.

Aggregate Data dialog q2

به این ترتیب اگر در قسمت Save‌ در پنجره اصلی گزینه …Add را انتخاب کرده باشیم، نتیجه به صورت زیر خواهد بود.

Aggregate Data dialog q2 result

سوال ۳: جمع فروش و میزان سفارش کالا به تفکیک نوع کالا، چقدر است؟

Aggregate Data dialog q3

پاسخ سوال ۳: توجه داشته باشید که متغیر نوع کالا به عنوان متغیر طبقه‌ای مورد استفاده قرار گرفته و تابع مورد محاسبه در پنجره Function، تابع SUM‌ انتخاب شده است. نتیجه اجرای این دستور به صورت زیر خواهد بود.

Aggregate Data dialog q3 results

سوال ۴: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به چه میزان است؟

پاسخ سوال ۴: برای پاسخ به این سوال می‌توانید به مانند روشی که در پاسخ سوال ۵ نیز گفته شده عمل کنید با این تفاوت که در قسمت Break Variable فقط از متغیر type به عنوان متغیر طبقه‌ای استفاده کنید. در نتیجه به منظور صرفه‌جویی در فضای نوشتاری از نمایش تصویر این دستور صرف‌نظر کرده‌ایم.

سوال ۵: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به تفکیک شیفت‌کاری چه میزان است؟

پاسخ سوال ۵: همانطور که در سوال مشخص است، برای پاسخ باید از دو متغیر طبقه‌ای، استفاده شود. همچنین برای هر دو متغیرهای عددی فروش (Sale) و سفارش (Purchase)، دو شاخص حداقل و حداکثر مورد احتیاج است. اگر تنظیمات پنجره Aggregate را مطابق با تصویر زیر ایجاد کنید، نتیجه مورد نظر، حاصل خواهد شد.

Aggregate Data dialog q5

همانطور که مشخص است، متغیرهای طبقه‌ای نوع کالا (type) و شیفت کاری (group) در کادر Break Variable قرار گرفته‌اند. همچنین برای محاسبه حداقل و حداکثر میزان فروش، دوبار متغیر sales به کادر Summaries of Variable وارد شده و برای هر کدام یکبار تابع MIN و یکبار هم تابع MAX به کار رفته است. همین عملیات نیز برای متغیر سفارش (Purchase) صورت گرفته. در قسمت Save نیز، انتخاب گزینه …Write a new، باعث می‌شود که خروجی این دستور در قالب یک فایل اطلاعاتی جدید به نام aggr.sav ثبت شود.

اگر می‌خواهید با استفاده از محیط Syntax، دستورات مربوط به پاسخ سوال ۵ را انجام دهید باید برنامه‌ای به شکل زیر را اجرا کنید.

نکته: همانطور که مشاهده کردید، دستور Aggregate باعث بوجود آمدن یک متغیر جدید، براساس جمع‌بندی روی مشاهدات می‌شود ولی نتیجه این محاسبات در خروجی SPSS ظاهر نمی‌شود. اگر می‌خواهید به جای متغیر جمع بندی در SPSS نتایج را به عنوان یک گزارش مشاهده کنید از دستوراتی که در ادامه معرفی می‌شوند، استفاده کنید.

جمع‌ بندی داده در SPSS با دستور OLAP Cube

OLAP Cube یا «مکعب‌های پردازش تحلیلی برخط» (Online Analytical Processing)، ابزاری برای جمع بندی داده در SPSS محسوب می‌شوند که درست به مانند جداول محوری (Pivotal Table) عمل می‌کنند و براساس آن‌ها می‌توان خروجی‌های متنوع و کاملی دریافت کرد. اغلب از ابزار OLAP‌، برای تهیه جدول‌های فراوانی یک یا دو طرفه و همچنین محاسبه شاخص‌های آماری براساس یک یا چند متغیر طبقه‌ای کمک گرفته می‌شود.

نکته: در تحلیل OLAP باید حتما در کادرهای اول و دوم این پنجره، متغیری معرفی شود، در غیر این صورت امکان انجام تحلیل وجود ندارد. از مزایای استفاده از OLAP، امکان بهره‌گیری از فیلتر در خروجی‌ها است که باعث می‌شود، نتایج بنا به انتخاب شما، محاسبه و نمایش داده شوند.

در تصویر زیر، شاخص‌های محاسباتی زیادی دیده می‌شوند که توسط دستور OLAP قابل اجرا هستند. بیشتر شاخص‌های آماری نظیر، میانگین، انحراف معیار، واریانس و حتی چولگی و برجستگی در این لیست دیده می‌شوند.

اگر در پنجره OLAP Cubes گزینه Differences را انتخاب کنید، پنجره‌ای به شکل زیر ظاهر شده که در آن می‌توانید برمبنای اختلافات بین متغیرها (Difference between variables) یا اختلاف بین گروه‌ها (Differences between groups) اختلاف شاخص‌های محاسباتی را بدست آورید.

نکته: اختلاف را می‌توان براساس اختلاف درصدی (Percentage difference) یا اختلاف ریاضیاتی (Arithmetic difference) در نظر گرفت.

برای پاسخ به سوالات گفته شده، تصویرهای که مربوط به دستور و تنظیمات پنجره OLAP Cubes است، در ادامه گنجانده شده‌اند.

سوال ۱: میانگین و انحراف معیار میزان فروش (Sale) چقدر است؟

پاسخ سوال ۱: با توجه به نکته ذکر شده در بخش OLAP Cubes، امکان پاسخ به این سوال وجود ندارد؛ زیرا حتما باید یک متغیر طبقه‌ای برای انجام محاسبات منظور شود.

سوال ۲: در چند ماه از ماه‌های سال، فروش کالا از میانگین فروش سالانه کمتر بوده است؟

پاسخ سوال ۲: متاسفانه پاسخ به این سوال نیز در حیطه عملیات مربوط به OLAP‌ نیست.

سوال ۳: جمع فروش و میزان سفارش کالا به تفکیک نوع کالا، چقدر است؟

پاسخ سوال ۳: اگر تنظیمات پنجره OLAP را مطابق با تصویر زیر انجام دهیم، می‌توانیم، خروجی مورد نظر را با توجه به گزینه‌ انتخابی Sum در پنجره Statistics ایجاد کنیم.

OLAP Cubes q4

در این صورت خروجی زیر حاصل خواهد شد.

OLAP Cubes q3 results

سوال ۴: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به چه میزان است؟

پاسخ سوال ۴: برای پاسخ به این سوال کافی است که تنظیمات پنجره OLAP‌ در قسمت Statistics را مطابق با تصویرهای زیر انجام دهیم.

OLAP Cubes Statistics q4

نتیجه اجرای این دستور مطابق با تصویر زیر خواهد بود.

OLAP Cubes q4 results

سوال ۵: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به تفکیک شیفت‌کاری چه میزان است؟

پاسخ سوال ۵: برای پاسخ به این سوال، کافی است که فقط متغیر group که مشخص کننده شیفت‌کاری است را به قسمت Grouping Variable در پنجره مربوط به سوال ۴ اضافه کنیم. نتیجه انجام این دستور به صورت یک جدول محوری خواهد بود که با دو بار کلیک روی خروجی، می‌توانید تنظیمات آن را تغییر دهید. همانطور که در تصویر زیر دیده می‌شود، استفاده از فیلترهای مربوط به متغیر طبقه‌ای، می‌تواند نتایج جمع‌بندی را تغییر دهد.

OLAP Cubes q5 results

پس از انجام تغییرات روی جدول OLAP، با کلیک روی صفحه خروجی، از حالت ویرایش خارج خواهید شد.

نکته: اگر می‌خواهید در محیط Syntax یا کد نویسی SPSS این دستور را اجرا کنید باید به کدی مشابه زیر بنویسید:

جمع‌ بندی داده در SPSS با دستور Case Summary

تقریبا پنجره‌ای که برای تنظیمات پارامترهای Case Summary ظاهر می‌شود با پنجره OLAP Cube یکسان است. همانطور که دیده می‌شود نام این پنجره Summarize Cases بوده و کادرهایی برای مشخص کردن متغیر محاسباتی و متغیر طبقه‌ای با نام‌های Variables و Grouping Variables در آن دیده می‌شود. همانگونه که مشخص است در کادر Variables باید متغیر یا متغیرهایی را قرار دهید که لازم است محاسبات جمع‌بندی رویشان صورت گیرد. این متغیرها ممکن است از نوع کمی (Scale) یا از نوع کیفی (Nominal-Ordinal) باشند.

همینطور در کادر (Grouping Variable(s نیز اسامی متغیرهای طبقه‌ای قرار می‌گیرند تا براساس آن‌ها، محاسبات مربوط به جمع‌بندی تفکیک شده و در خروجی ظاهر شوند.

می‌توانید با استفاده از امکانات این پنجره کلیه مشاهدات را هم در خروجی ظاهر کنید. حتی این امکان نیز وجود دارد که در قسمت پایین این پنجره، نمایش مشاهدات را محدود کنید. در ادامه به معرفی این گزینه‌ها خواهیم پرداخت.

  • با انتخاب گزینه Display Cases، در پنجره خروجی، گزارشی در مورد وضعیت مشاهدات ظاهر می‌شود. این گزارش شامل مقادیر همه متغیرها و شماره مشاهدات آن‌ها است. البته اگر تعداد مشاهدات (Cases) زیاد باشد، سطرهای زیادی از خروجی به این امر اختصاص خواهد یافت. بدیهی است با عدم انتخاب این گزینه، مشاهدات در خروجی قرار نگرفته و فقط شاخص‌ها و نتایج جمع‌بندی ظاهر خواهند شد.
  • به منظور کاهش حجم خروجی می‌توانید از کادر Limit cases to first، برای تعیین تعداد مشاهداتی که باید در خروجی ظاهر شوند، استفاده کنید. به طور پیش‌فرض تعداد مشاهدات در این کادر ۱۰۰ در نظر گرفته شده است. به این ترتیب نمونه‌ای از مقادیر مشاهدات در گزارش ظاهر می‌شود.
  • اگر می‌خواهید فقط مشاهداتی که همه متغیرهای آن‌ها دارای مقدار هستند ظاهر شوند، گزینه Show only valid cases را انتخاب کنید. به این ترتیب سطرهایی از مجموعه داده که دارای مقدار گمشده (Missing Value) هستند در گزارش ظاهر نخواهند شد.
  • با انتخاب گزینه Show case numbers، شماره ردیف هر مشاهده نیز در ستون اول خروجی ظاهر می‌شود.

همچنین در سمت راست پنجره Summarize Cases، دکمه‌هایی برای تعیین ویژگی‌ها محاسباتی و تنظیمات اختیاری (Options) قرار دارد. با فشردن دکمه Statistics، پنجره‌ای به مانند پنجره Statistics در دستور OLAP Cubes ظاهر می‌شود که شاخص‌های جمع‌بندی را مشخص می‌کند. همچنین دکمه Options نیز برای تنظیم عناوین و برچسب‌های خروجی به کار می‌رود. پنجره‌ای که با فشردن این دکمه ظاهر می‌شود در تصویر زیر مشخص شده است. عملکرد هر بخش از گزینه‌های این پنجره نیز در ادامه قابل مشاهده است.

  • کادر Title برای نام‌گذاری جدول خروجی استفاده می‌شود.
  • کادر Caption نیز متنی را مشخص می‌کند که قرار است در پایین جدول خروجی این دستور ظاهر شود.
  • اگر Subheadings for totals را انتخاب کنید، هر بخش از خروجی براساس متغیر طبقه‌ای که در کادر Grouping Variables مشخص کرده‌اید، دارای عنوان مجزایی خواهد شد.
  • با انتخاب کادر …Exclude cases، در خروجی از نمایش مشاهداتی که دارای مقدار گمشده (Missing Values) هستند جلوگیری خواهد شد.
  • ممکن است برای بعضی از انواع متغیرها، یک یا چند شاخص یا محاسبات جمع‌بندی، میسر نباشد، با وارد کردن علامت یا حرفی برای مشخص کردن این گونه محاسبات در کادر Missing statistics appear as، آن‌ها را متمایز خواهید کرد.

برای پاسخ به سوالات گفته شده، تصویرهای که مربوط به تنظیمات پنجره دستور Case Summary است، در ادامه نمایش داده شده‌اند.

سوال ۱: میانگین و انحراف معیار میزان فروش (Sale) چقدر است؟

خروجی به صورت زیر خواهد بود.

سوال ۲: در چند ماه از ماه‌های سال، فروش کالا از میانگین فروش سالانه کمتر بوده است؟

متاسفانه پاسخ به این سوال در حیطه دستور Case Summary قرار ندارد.

سوال ۳: جمع فروش و میزان سفارش کالا به تفکیک نوع کالا، چقدر است؟

Case Summary q3

البته توجه داشته باشید که به کمک دکمه Statistics، نوع محاسبه را تابع SUM‌ انتخاب کنید. خروجی این دستور به صورت زیر خواهد بود.

Case Summary q3 results

سوال ۴: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به چه میزان است؟

برای پاسخ به این سوال کافی است که فقط با استفاده از دکمه Statistics‌ گزینه‌های Maximum ‌و Minimum‌ را برای محاسبه درخواست کنید. بقیه تنظیمات درست به مانند سوال ۳ خواهد بود. نتیجه مطابق با تصویر زیر است.

Case Summary q4 results

سوال ۵: حداکثر و حداقل فروش و سفارش برای هر نوع کالا در طول سال به تفکیک شیفت کاری چه میزان است؟

برای پاسخ به این سوال، درست به مانند پاسخ سوال ۴ عمل کرده ولی متغیر group را هم به قسمت (Grouping Variable(s اضافه می‌کنیم. خروجی به صورت زیر در خواهد آمد.

Case Summary q5 results

همانطور که در جدول خروجی دیده می‌شود، هر سطح از متغیر طبقه‌ای type با سطوح مختلف متغیر طبقه‌ای group‌، ترکیب شده و مقدار حداقل و حداکثر فروش و سفارش محاسبه شده است.

نکته: به منظور اجرای این دستورات در محیط Syntax و به صورت کد نویسی، باید مشابه دستوراتی که در ادامه مشاهده می‌کنید را وارد و اجرا کنید.

خلاصه و جمع‌بندی

در این نوشتار با نحوه محاسبه بعضی از روش‌های جمع بندی در SPSS آشنا شدیم و ویژگی‌های هر یک از روش‌ها را هم بازگو کردیم. اغلب نیاز داریم که نتایج حاصل از محاسبات را طی گزارشی، ارائه دهیم در نتیجه بعضی از روش‌ها جمع‌بندی که به تولید خروجی منجر می‌شوند در این حالت مسئله کاربرد خواهند داشت، ولی اگر نیاز است که براساس نتایج جمع‌بندی، تحلیل‌ها و محاسبات دیگری صورت گیرد بهتر است از روش‌هایی استفاده کنیم که مانند Aggregate باعث بوجود آمدن متغیر جدید خواهند شد.

اگر این مطلب برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *