آمار، داده کاوی ۹۹۸۳ بازدید

داده‌ها، نتیجه مشاهده یا اندازه‌گیری پدیده‌ها طبیعی یا مصنوعی هستند. از طرفی می‌دانیم، افراد و اشیائی که مشخصات و ویژگی‌های مربوط به موضوع مورد بررسی از آن‌ها اندازه‌گیری می‌شوند، جامعه آماری را شکل می‌دهند. به این ترتیب، در جامعه آماری، مشخصات و ویژگی‌های یک پدیده مورد اندازه‌گیری قرار گرفته و نسبت به شناخت آن، دانش مفیدی کسب می‌کنیم. اعضای جامعه آماری، دارای خصوصیات یا ویژگی‌های مشترکی هستند، در غیر اینصورت امکان حضورشان در کنار یکدیگر میسر نمی‌شد. هر یک از این ویژگی‌ها، براساس شیوه خاصی اندازه‌گیری و مورد تجزیه و تحلیل قرار می‌گیرند. به همین جهت در این نوشتار از مجله فرادرس می‌خواهیم با انواع داده ها در SPSS به عنوان یک نرم افزار پرکاربرد در حوزه آمار و تحلیل داده، آشنا شویم.

اگر می‌خواهید با نحوه ورود مقادیر و تعریف متغیرها در این نرم‌افزار بیشتر آشنا شوید، نوشتارهای پنجره ویرایشگر داده (Data Editor) در SPSS — راهنمای کاربردی و پنجره خروجی SPSS یا Output — راهنمای کاربردی را مشاهده کنید. البته در این بین به دانشی در مورد ساختار داده‌ها و مقیاس‌های اندازه‌گیری در جامعه آماری احتیاج دارید که با خواندن مطالب جامعه آماری – انواع داده و مقیاس‌های آن‌ها و مفاهیم آماری: آمار و جامعه آماری — به زبان ساده به چنین اطلاعاتی دست خواهید یافت.

انواع داده ها در SPSS

زمانی که یک متغیر را در SPSS، تعریف می‌کنید، اولین کار انتخاب یک نام برای آن است. اسامی متغیرها در بالای ستون‌های مقادیر در برگه Data View از «پنجره ویرایشگر داده» (Data Editor) ظاهر می‌شوند. به این ترتیب ستون‌ها را می‌توان همان «فیلدها» (Fields) در «بانک‌های اطلاعاتی» (Database) محسوب کرد.

هنگام انتخاب نام، باید دقت کنید تا با موازین SPSS، هماهنگ باشد. محدودیت‌هایی که برای تعیین نام متغیر در SPSS وجود دارند، در ادامه فهرست شده‌اند.

  • تعداد حروف: حداکثر نام برای متغیرها، ۶۴ حرف یا در حقیقت ۶۴ بایت (Byte) است. البته اگر از نام‌گذاری متغیرها با حروف فارسی استفاده کنید، تعداد این حروف نصف شده و به ۳۲ حرف می‌رسد. زیرا حروف فارسی به جای یک بایت، از دو بایت هنگام ذخیره سازی، استفاده می‌کنند.
  • علائم غیرمجاز: استفاده از فاصله در نام‌گذاری غیر مجاز است. معمولا برای جدا کردن بخش‌های نام متغیر از علامت «ـ» استفاده می‌کنند. همچنین هنگام نام‌گذاری، نباید ابتدای هیچ متغیری از اعداد یا علائم، $ , # و @ استفاده شود ولی می‌توان از آن‌ها در میان عبارت نام، استفاده کرد. برای مثال A._$@#1 یک نام معتبر است.
  • اسامی غیرمجاز: بعضی از اسامی برای متغیرها در spss، غیر مجاز هستند، زیرا در جای دیگری از این اسامی به عنوان «متغیرهای سیستمی» (System Variables) استفاده شده است. برای مثال عبارتی مانند AND, OR و یا ALL برای نام‌گذاری مناسب نیستند و با انتخاب آن‌ها برای متغیرها، با پیغام خطا مواجه خواهید شد.
  • غیرتکراری: نام هیچ متغیری در یک مجموعه داده (Dataset)، نباید تکراری باشد. تکراری بودن نام متغیرها، طی پیامی به اطلاع کاربران SPSS می‌رسد.

نکته: به کار بردن اسامی فارسی برای متغیرها مجاز است به شرطی که امکان به کارگیری حروف با Unicode را فعال کرده باشید. البته بهتر است اسامی متغیرها را انگلیسی ولی برچسب (Label) آن‌ها را فارسی انتخاب کنید. باز هم تاکید می‌کنیم که به کار بردن فاصله بین اجزای نام متغیر، مجاز نیست. برای فعال سازی Unicode به تصویر ۱ توجه کنید.

Unicode options
تصویر ۱: پنجره تنظیمات پیش‌فرض SPSS و انتخاب نحوه ورود داده با Unicode

پس از انجام تغییرات، با فشردن دکمه OK، آن‌ها را اعمال کنید. البته به یاد داشته باشید که «تنظیمات کدگذاری حروف» (Character Encoding) مخصوص داده‌ها و نوشتن دستورات در پنجره Syntax است.

نکته: دسترسی به پنجره تغییر کدگذاری فقط زمانی امکان‌پذیر است که هیچ فایل داده نبوده و اطلاعاتی وارد نشده باشد. به بیان دیگر به محض اجرای SPSS، می‌توانید این کار را انجام دهید.

انتخاب نام برای متغیرها، در برگه Variable View در پنجره ویرایشگر داده (Data Editor) صورت پذیرد. به تصویر ۲ توجه کنید.

variable names and types in spss
تصویر ۲: تعیین نام متغیر و نوع آن در نرم‌افزار SPSS در پنجره ویرایشگر داده (Data Editor)

تعیین نوع متغیرها در SPSS

ویژگی دیگر متغیرها در SPSS، نوع مقدار آن‌ها است. این خصوصیت براساس نوع اطلاعاتی که در آن‌ها ثبت می‌شوند، تعیین می‌گردد. این ویژگی در پنجره ویرایشگر داده، با نام Type مشخص شده است. می‌توانید نوع متغیر را در تصویر ۱ و در ستون Type مشاهده کنید. اگر روی دکمه $$\cdots$$ که در قسمت Type قرار گرفته است، کلیک کنید، گونه‌های قابل انتخاب برای متغیرها را مشاهده خواهید کرد. در تصویر ۳، انواع متغیرهای قابل انتخاب در SPSS دیده می‌شوند. توجه داشته باشید که نوع متغیرها بر انتخاب انواع داده ها در SPSS تاثیر گذار است.

variable types
تصویر ۳: نوع مقادیر قابل ثبت در متغیرهای SPSS

جدول زیر به معرفی نوع متغیرها در SPSS پرداخته است.

جدول ۱: نوع متغیرها در SPSS

ردیف نوع نوع مقدار توضیحات
۱ Numeric عددی با تنظیم تعداد ارقام اعشار و صحیح
۲ Comma عددی با جدا کننده هزارگان بوسیله کاما
۳ Dot عددی با جدا کننده هزارگان بوسیله نقطه
۴ Scientific notation عددی نماد علمی
۵ Date عددی نمایش عدد برحسب تاریخ
۶ Dollar عددی نمایش عدد برحسب واحد ارزی استاندارد
۷ Custom currency عددی نمایش عدد برحسب واحد ارزی دلخواه
۸ String متنی عبارت متنی با طول ۳۲768 حرف
۹ Restricted Numeric عددی عدد صحیح (با طول ثابت) با نمایش صفر در ابتدای آن

نکته: توجه داشته باشید که ممکن است در بعضی از تحلیل‌های SPSS، داده‌های متنی قابل استفاده نباشند. برای مثال در تحلیل واریانس (ANOVA)، متغیری که به عنوان Factor معرفی می‌شود، نباید متنی باشد. در نتیجه چنین متغیری در لیست متغیرهای قابل استفاده، مشاهده نخواهد شد.

همانطور که مشاهده می‌کنید، متغیرها از نوع تاریخ یا نماد علمی یا حتی ارزی، همگی عددی هستند و فقط شیوه نمایش آن‌ها (Format) تغییر پیدا می‌کند. تنها در حالتی که متغیر از نوع متنی باشد، ماهیت تغییر کرده و دیگر عددی محسوب نمی‌شود.

به یاد داشته باشید که اگر متغیری از نوع عددی، در نرم‌افزار SPSS، تعریف شده باشد، دیگر نمی‌توان در آن مقادیر متنی یا حروف وارد کرد ولی برای متغیرهای متنی، استفاده از اعداد مجاز است. ولی مرتب‌سازی و فیلتر کردن براساس مقادیر متنی روی چنین متغیرهایی، اعمال خواهد شد.

حال که با انواع متغیرهای قابل تعریف در SPSS آشنا شدید، به سراغ مقیاس متغیرها و نوع داده ها در SPSS خواهیم رفت. ابتدا دو دسته مهم از داده‌ها را معرفی کرده، سپس به تفکیک و شناخت گونه‌های آن‌ها در SPSS خواهیم پرداخت. همانطور که می‌دانید، معمولا براساس طبقه‌بندی مقادیر آماری، آن‌ها را به دسته «کیفی» (Qualitative) و «کمی» (Quantitative) دسته بندی می‌کنند. این دسته‌بندی یک شیوه برای تعیین انواع داده ها در SPSS در اختیارمان قرار می‌دهد.

دسته مقادیر کیفی

دسته یا گروه مقادیر کیفی، از طریق ثبت ویژگی به صورت اسامی مختلف تعیین می‌شوند. ویژگی‌هایی نظیر محل تولد، گروه خون، رنگ مورد علاقه و … از نوع داده‌های کیفی هستند. البته به یاد داشته باشید که ممکن است در مورد مقدار متغیر یا ویژگی‌های کیفی، سلیقه فرد مشاهده کننده یا شیوه اندازه‌گیری نیز موثر باشد و برای یک عضو از جامعه آماری دو یا چند مقدار برای ویژگی کیفی از نظر افراد مختلف بدست آید. برای مثال رنگی ممکن است از دید یک نفر رنگ آبی باشد و از نظر فرد دیگر، رنگ فیروزه‌ای به نظر برسد. به همین دلیل، معمولاً انتخاب مقدار برای این ویژگی‌ها، احتیاج به تخصص و از طرفی دقت نظر فراوان دارد.

داده‌هایی که به شکل کیفی هستند، معمولا به صورت متنی یا یک عبارت حرفی ثبت می‌شوند. ولی اغلب برای استفاده از داده‌های کیفی در نرم‌افزارهای آماری، آن‌ها را به صورت عددی نمایش می‌دهیم. مشخص است که عددی بودن این مقادیر به معنی امکان انجام محاسبات روی آن‌ها نیست. به یاد داشته باشید که این اعداد فقط کد‌هایی برای نمایش مقدارهای کیفی هستند و یکی از انواع داده ها در SPSS محسوب می‌شود.

دسته مقادیر کمی

این دسته از اندازه‌ها، به کمک شمارش یا اندازه‌گیری با ابزارهای مشخص بدست می‌آیند. این نوع داده‌ها با توجه به واحد اندازه‌گیری آن ویژگی، بوسیله اعداد بیان می‌شوند. برای مثال در این دسته می‌توان به ویژگی‌هایی مانند طول (با واحد متر، اینچ، میلیمتر، سال نوری و …)،‌ وزن (با واحد گرم، تن و …)، فشار، دما و غیره اشاره کرد.

از آنجایی این نوع داده‌ها به صورت عددی هستند، می‌توان محاسبات ریاضی، مانند جمع، میانگین‌گیری را روی آن‌ها انجام داد. همچنین مرتب‌‌سازی (به صورت صعودی یا نزولی) براساس این اندازه‌ها امکان‌پذیر است. به همین جهت اغلب برای مقایسه دو یا چند جامعه که ویژگی آن‌ها، کمی است از میانگین، واریانس و دیگر شاخص‌های آماری استفاده می‌شود. یکی از مهم‌ترین انواع داده ها در SPSS که کاربرد فراوانی دارد، داده یا مقادیر کمی است.

اگر مقادیر کمی، از طریق شمارش حاصل شده باشند، «مقادیر گسسته» (Discrete) و اگر بوسیله اندازه‌گیری (با توجه به خطای اندازه‌گیری) بدست آیند، داده‌های پیوسته (Continues) نامیده می‌شوند. حال زمان آن رسیده که به بررسی انواع مقیاس‌های متغیرها و انواع داده ها در SPSS بپردازیم.

انتخاب و تعیین انواع داده ها در SPSS

قبل از شروع کار با نرم‌افزار محاسبات آماری SPSS، لازم است که متغیرها را معرفی کنیم. هر مقدار یا دسته‌ای از مقادیر حتما باید وابسته به یک متغیر باشد. انتخاب صحیح برای انواع داده ها در SPSS بسیار با اهمیت است، زیرا بعضی از روش‌های آماری در این نرم‌افزار فقط با توجه به انتخاب صحیح نوع داده صورت می‌گیرد. برای مثال، رسم نمودار یا ترسیم جدول برای داده‌ها، با توجه به اینکه کاربر به درستی نوع مقادیر یا مقیاس اندازه را وارد کرده، امکان‌پذیر می‌گردند. بنابراین اگر این کار به درستی انجام نشده باشد، کاربر، یا با پیغام خطا مواجه خواهد شد، یا خروجی به شکل اشتباه در پنجره نتایج SPSS، نقش خواهد بست.

به یاد داشته باشید که اغلب در یک جامعه آماری، از متغیرهای کمی برای محاسبه شاخص‌ها و از متغیرهای کیفی برای طبقه‌بندی یا تفکیک جامعه آماری به بخش‌های کوچکتر، استفاده می‌شود. همین موضوع، بخصوص در نرم‌افزارهای آماری، نظیر SPSS نیز لحاظ شده است. سه نوع مقیاس اندازه، در این نرم‌افزار مورد توجه است که در زیر فهرست شده‌اند.

  • مقیاس اسمی (Nominal): برای متغیرهای کیفی با مقادیر متنی یا عدد مناسب است. نماد این گونه داده در SPSS به صورت زیر است. وجود دایره‌هایی به شکل نمودارهای دایره‌ای، از ویژگی‌های این مقیاس در SPSS است.

nominal scale in spss

  • مقیاس ترتیبی (Ordinal): برای متغیرهای کیفی که دارای مقادیر متنی یا عددی هستند و همچنین می‌توان آن‌ها را به شکلی مرتب کرد، مورد استفاده قرار می‌گیرد. برای تمایز این گونه مقیاس از مقیاس‌های دیگر در SPSS‌ از نماد زیر استفاده می‌شود. نمایش نمودار ستونی به ترتیب بزرگی، نمایانگر وجود ترتیب در چنین مقیاسی است.

ordinal scale in spss

  • مقیاس عددی (Scale): این نوع مقیاس، مناسب برای داده‌های کمی است. واضح است که انجام محاسبات ریاضی و مرتب‌سازی از ویژگی‌های اصلی این مقیاس است. در SPSS برای نمایش چنین مقیاسی از شکل یک خط کش به مانند تصویر زیر، استفاده می‌شود.

scales measure

در ادامه هر یک از این مقیاس‌ها را معرفی کرده و نحوه انتخاب انواع داده ها در SPSS را شرح می‌دهیم.

مقیاس اسمی (Nominal)

برای مشخص کردن مقادیری که برای طبقه‌بندی جامعه آماری مناسب هستند، از «مقیاس اسمی» (Nominal Measurement) در نرم‌افزار SPSS، استفاده می‌کنیم. زمانی یک متغیر می‌تواند به عنوان یک متغیر با مقیاس اسمی در نظر گرفته شود که مقادیر آن، رده‌هایی را نشان دهد که هیچ رتبه بندی ذاتی نداشته و قابل مرتب‌سازی نباشند. به عنوان مثال بخش‌های یک شرکت، یک متغیر با مقیاس اسمی است. به این ترتیب هنگامی که ویژگی‌های کارمندان را ثبت می‌کنیم، محل خدمت یا بخش محل کار را از نوع اسمی انتخاب خواهیم کرد.

نمونه‌هایی از متغیرهای اسمی شامل منطقه، کد پستی یا جنسیت وضعیت تاهل یا مذهب است. مقیاس اسمی همچنین می‌تواند توسط محقق کدگذاری شود تا فرایند تجزیه و تحلیل، آسان شود. برای مثال وضعیت تاهل را برای افراد متاهل به صورت «M» و برای مجردها را به صورت «S» نشان داده یا ثبت می‌کنیم. این کار هم سرعت ورود داده‌ها را در SPSS افزایش داده و همینکه جلوی اشتباه تایپی را می‌گیرد.

برای مشخص کردن این مقیاس برای یک متغیر در SPSS، مطابق با تصویر ۴، عمل خواهیم کرد. به این معنی که در ستون Measurement، گزینه Nominal را برای آن متغیر در نظر می‌گیریم. وجود دایره‌ای شبیه «نمودار ون» (Venn Diagram) وجه تمایز این گزینه از سایر انتخاب‌های این فهرست است.

نکته: تعیین این نوع مقیاس برای متغیر، در ورود داده‌ها، محدودیتی ایجاد نمی‌کند. بلکه فقط در هنگام اجرای تحلیل‌های خودکار، SPSS را از نحوه برخورد با آن متغیر آگاه خواهد کرد. به یاد داشته باشید که محدودیت در نوع داده‌ها و مقادیر ورودی، توسط گزینه Type در برگه Variable View صورت می‌گیرد.

مقیاس ترتیبی (Ordinal)

وقتی یک متغیر کیفی می‌تواند دارای ترتیب باشد، بهتر است از مقیاس ترتیبی برای ایجاد آن در SPSS استفاده شود. ویژگی ترتیب پذیری، معمولا به صورت ذاتی در این متغیرها وجود دارد، برای مثال اندازه با مقادیر «کوچک»، «متوسط» و «بزرگ» تشکیل یک متغیر ترتیبی می‌دهد. البته ممکن است ترتیب به صورت قراردادی نیز اعمال شود، مانند مدرک تحصیلی که از مثلا دیپلم تا دکتری قابل مرتب سازی است.

اغلب در طراحی پرسشنامه‌های نظر خواهی یا رضایتمندی، از متغیرهای با مقیاس ترتیبی استفاده می‌کنند. به عنوان مثال، سطح رضایت از خدمات از مقادیر «بسیار ناراضی» تا «بسیار راضی» تغییر کرده که نشانگر یک ترتیب ذاتی است. نمونه‌هایی از متغیرهای ترتیبی مثل میزان رضایتمندی در بین مصرف کنندگان، به صورت عددی نیز کد بندی می‌شوند. درجه اولویت از بسیار زیاد به بسیار کم قابل تغییر است. به طور کلی، ترجیح داده می‌شود که کدهای عددی برای نشان دادن درجه چیزی در بین پاسخ دهندگان اختصاص یابد. به عنوان مثال 5 = بسیار راضی ، 4 = راضی ، 3 = خنثی ، 2 = ناراضی ، 1 = بسیار ناراضی. اگر فاصله بین هر دو مقدار عددی پشت سر هم، یکسان باشد، می‌توان آن را یک «طیف لیکرت» (Likert Scale) نامید.

به منظور انتخاب مقیاس ترتیبی برای یک متغیر در SPSS، به تصویر ۴ مراجعه کنید. البته در بعضی از موارد به صورت موقت می‌توان مقیاس متغیر را از ترتیبی به اسمی یا نسبی (Scale) تغییر داد. این مورد در ادامه و طی یک مثال برای ایجاد جدول در SPSS، مطرح خواهد شد.

نکته: تعیین متغیرها از نوع ترتیبی و اسمی درست به مانند تعیین متغیر عامل در زبان برنامه‌نویسی محاسبات آماری R است که توسط دستور Factor تعیین می‌شود. این کار در SPSS، راهنمای خوبی در هنگام اجرای دستورات تحلیل خودکار است. باز هم به یاد داشته باشید که انتخاب مقیاس ترتیبی، در مقادیر ورودی برای متغیر، محدودیتی ایجاد نمی‌کند.

مقیاس نسبی (Scale)

زمانی که با داده‌هایی از نوع کمی سروکار داریم، بهتر است از «مقیاس نسبی» (Ratio) برای کار در SPSS، استفاده کنیم. نوع داده ها در SPSS برای مقیاس نسبی، عددی است و امکان انجام محاسبات ریاضی روی آن‌ها وجود دارد.

مقیاس نسبی (Ratio) در SPSS به صورت «Scale» مشخص می‌شود. بنابراین اگر می‌خواهید یک متغیر کمی با ویژگی نسبی را در این نرم‌افزار مشخص کنید، باید مطابق با تصویر ۴، نوع متغیر را Scale انتخاب کنید. زمانی که از Scale به عنوان یکی از انواع داده ها در SPSS استفاده می‌کنید، صفر به معنی هیچ بوده و با «مقیاس فاصله‌ای» (Interval) در جامعه آماری، در این ویژگی تفاوت دارد. طول، وزن و … داده‌هایی با مقیاس نسبی هستند. در حالیکه مثلا دما به عنوان یک ویژگی فاصله شناخته می‌شود. هر چند از نظر SPSS این دو نوع، یکسان در نظر گرفته می‌شوند.

نکته: توجه داشته باشید که در SPSS امکان تعریف متغیر از نوع یا مقیاس فاصله‌ای وجود ندارد. برای معرفی چنین متغیرهایی در SPSS ، بهتر است از همان نوع نسبی (Scale) استفاده کنید. به یاد داشته باشید که در داده‌های فاصله‌ای صفر مقداری قراردادی است ولی برای متغیرهای Scale، صفر به معنی هیچ است.

برای نمونه، متغیرهای «سن» برحسب سال و «درآمد» برحسب هزار تومان یا «نمره دانش آموز در آزمون GRE» می‌توانند از نوع Scale انتخاب شوند. واضح است که داشتن ترتیب و انجام محاسبات ریاضی روی چنین متغیرهایی، امکان‌پذیر است. برای مثال می‌توانیم میانگین نمرات GRE یک کلاس را محاسبه کرده یا بوسیله محاسبه واریانس، پراکندگی درآمد در یک جامعه را مورد بررسی قرار دهیم.

در پرونده ورودی SPSS ، لازم است متغیرها را بر اساس مقیاس «اسمی»، «ترتیبی» یا «نسبی» مقیاس‌بندی کنید. این کار مطابق با تصویر ۴ صورت می‌گیرد. البته به یاد داشته باشید که در تصویر زیر، مقیاس‌های قابل انتخاب برای متغیر عددی (Numeric)‌ را نمایش داده‌ایم.

scale of measurement in spss
تصویر ۴: انواع داده ها در SPSS برای متغیر عددی

توجه داشته باشید که اگر متغیری از نوع «متنی» (String) باشد، گزینه Scale به عنوان مقیاس اندازه برایش در SPSS غیر فعال خواهد شد. به تصویر ۵ توجه کنید.

string type of measurement in spss
تصویر ۵: انتخاب مقیاس‌های مجاز برای متغیرهای متنی

مشخص است که متغیر feedback به عنوان یک متغیر متنی (String) است، به همین جهت امکان انتخاب گزینه Scale در گزینه‌های Measure برای این متغیر وجود ندارد. مشخصات و ویژگی‌های متغیرها مربوط به تصویر ۵، در ادامه متن مورد بررسی قرار گرفته است.

اگر می‌خواهید از SPSS برای کنترل فرآیند تولید یا خدمات استفاده کنید، می‌توانید یکی از آموزش‌های فرادرس در این حوزه آمار و احتمالات و همچنین نرم‌افزارهای آماری را مشاهده کنید. لینک دسترسی به این آموزش در ادامه آورده شده است.

انواع داده ها در SPSS در یک تحقیق پرسشنامه‌ای

در این قسمت با توجه به تصویر ۵، به معرفی ویژگی‌های متغیرهای به کار رفته در یک پرسشنامه تحقیقی خواهیم پرداخت.

نکته: توجه داشته باشید که در صورت تعیین نکردن ویژگی ستون Measure در SPSS، به محض ورود مقادیر در برگه Data View، نرم‌افزار، به طور خودکار مقیاس مناسب را به کار خواهد برد. برای مثال متغیرهایی که با مقادیر متنی همراه باشند، به صورت Nominal و متغیرهایی که با مقادیر عددی و اعشار به کار گرفته شوند، از نوع Scale خواهند بود.

در ادامه فهرست این متغیرها به همراه ویژگی‌هایشان معرفی شده‌اند.

  • متغیر Hardwork: از این متغیر برای سنجش میزان سختی کار استفاده می‌کنیم. از شرکت کننده در طرح تحقیقی خواسته می‌شود که میزان سختی کار را برحسب مقداری از ۰ تا ۱۰۰، مشخص کند. واضح است این مقدار باید از نوع عددی باشد. از طرفی محاسبه میانگین برای این متغیر وجود دارد، پس بهتر است آن را با مقیاس Scale مشخص نماییم.
  • متغیر Performance: این متغیر با توجه به میزان کارایی پاسخ دهنده، تنظیم شده است. مقدار آن از نوع عددی است ولی مقیاس (Measure) برایش تعیین نشده است. بنابراین عبارت Unknown، برای این متغیر در بخش Measure ظاهر شده است. به محض ورود مقادیر برای چنین متغیری، SPSS به طور خودکار، مقیاس مناسب برای آن را انتخاب خواهد کرد. اگر مقادیر به صورت اعشاری باشند، مقیاس Scale و اگر مقادیر گسسته یا عدد صحیح داشته باشند، Nominal یا Ordinal گزینه‌های مناسب از نظر SPSS خواهند بود.
  • متغیر Age: سن پاسخ دهنده برحسب سال، در این متغیر قرار می‌گیرد. از آنجایی که نوع مقادیر عدد صحیح (…Restricted) برای آن در نظر گرفته شده، کاربر فقط اجازه ورود مقادیر از مجموعه اعداد صحیح را خواهد داشت.
  • متغیر Gender: این متغیر برای مشخص کردن جنسیت افراد در نظر گرفته شده. با توجه به نوع عددی برای آن، کاربر مجاز است که برای مثال یکی از مقادیر ۰ و ۱ را وارد کند. بنابراین بهتر از مقیاس Nominal را برای مقیاس این متغیر استفاده شود. می‌توان به وسیله کدگذاری جنسیت زن را با «۱» و مرد را با مقدار «۰» نشان داد.
  • متغیر Income: متغیر درآمد در این بخش معرفی شده است. برای مقادیر عددی آن از نوع Comma استفاده شده تا ارقام به صورت جداکننده هزارگان، نمایش داده شوند. مقیاس مناسب برای این متغیر از مقیاس Scale استفاده کرده تا نشانگر کمی بودن آن باشد.
  • متغیر population: تعداد اعضای خانوار توسط این متغیر مشخص شده است. واضح است که مقادیر این متغیر باید عددی بوده و چون قابلیت محاسبات ریاضی دارد، از مقیاس Scale برای مشخص کردن، استفاده شده است.
  • متغیر name: هر پاسخ دهنده در این بخش نام خود را وارد می‌کند. واضح است که مقادیر باید از نوع متنی باشند. بنابراین یا باید از مقیاس Ordinal یا Nominal استفاده شود. از آنجایی که در نام افراد، ترتیبی قائل نیستم، از گزینه Nominal برای مقیاس متغیر نام استفاده کرده‌ایم.
  • متغیر feedback: فرض کنید که قرار است نظر پاسخ دهنده را از کاری که انجام می‌دهد، بپرسیم. یک متغیر «متنی» (string) به نام feedback در اینجا در نظر گرفته شده که طبیعتاً باید با مقیاس Nominal ایجاد شود.
  • متغیر XYZ: این یک متغیر کمکی است که برای ثبت مقادیر عددی در نظر گرفته شده و پهنای ستون آن (Column) شامل ۳۵ رقم است.

نکته: توجه داشته باشید که برای متغیرهای Name و feedback به ترتیب ۱۰۰ و ۱۰۰۰ حرف در نظر گرفته شده ولی پهنای ستون آن‌ها فقط ۱۲ و ۱۷ حرف را مشخص کرده است. این امر به این معنی است که فضای نمایش ستون برای این مقادیر فقط ۱۲ یا ۱۷ حرف است و بقیه حروف و عبارت‌ها، در پنجره ویرایشگر داده، قابل مشاهده نبوده ولی قابلیت پردازش دارند.

تغییر مقیاس داده در SPSS

توجه داشته باشید که می‌توان نوع متغیر را در هنگام اجرای تحلیل نیز تغییر داد. هر گاه لازم باشد، برای مثال در هنگام اجرای دستور Table، می‌توان به طور موقت، نوع داده یا مقیاس را تغییر داد تا انجام آنالیز و تشکیل جدول مورد نظر، به شکل درست صورت گیرد. به منظور دسترسی به دستور ایجاد جدول در SPSS مسیر زیرا طی کنید.

Analyze – Table – Custom Table

فرض کنید پنجره‌ای که برای ایجاد جدول ظاهر شده است، مطابق با تصویر ۶ باشد و قرار است متغیری که با نام a مشخص شده را از مقیاس اسمی (Nominal) به مقیاس عددی (Scale) تغییر دهیم. برای این کار کافی است که بر روی متغیر در کادر متغیرها، کلیک راست کرده و از فهرست ظاهر شده، یکی از گزینه‌های مناسب (در اینجا Scale) را انتخاب کنید.  همانطور که در تصویر ۶، قابل مشاهده است، در فهرست کلیک راست هر سه گزینه برای انتخاب انواع داده ها در SPSS ظاهر شده است.

change scale of measurement in spss
تصویر ۶: فهرست کلیک راست در دستور Table و تغییر انواع داده ها در SPSS

تغییر مقیاس متغیر براساس انواع داده ها در SPSS به این علت انجام شده است که محاسبات مربوط به دسته‌بندی و گروه‌بندی در دستور Table، به صورت خودکار، برای متغیرهای کیفی (Nominal ,Ordinal) صورت می‌گیرد ولی محاسبه مثلا میانگین واریانس برای متغیرهای کمی (Scale) امکان‌پذیر است. بنابراین اگر می‌خواهیم برای مثال میانگین را برای متغیر a محاسبه کنیم، باید آن را به صورت Scale درآوریم.

نکته: تغییر متغیر متنی (String) به عددی (Numeric) میسر نیست، زیرا مقادیر این متغیر، همگی متنی هستند. ولی اگر این کار صورت گیرد، همه مقادیر متغیر که با حروف الفبا نوشته شده‌اند، به صورت مقادیر گمشده (Missing Value) ثبت شده و به شکل ($$\cdot$$) نمایش داده می‌شوند. ولی مقادیر عددی پس از تغییر، در این ستون به شکل ارقام نمایش داده می‌شوند.

معرفی فیلم آموزش کنترل کیفیت آماری با SPSS فرادرس

آموزش کنترل کیفیت آماری با SPSS

استفاده از نرم افزارهای محاسبات آماری نظیر SPSS، انجام محاسبات پیچیده و طولانی آماری را آسان کرده و دقت انجام آن‌ها را می‌افزاید. کنترل کیفیت آماری (Statistical Quality Control) یکی از مواردی است که به کمک نرم افزار SPSS قادر هستیم، محاسبات آماری و رسم نمودارهای مربوطه را به سادگی انجام دهیم. تحلیل فرایند و نمایش زمان خروج از کنترل در فرایند تولید یا ارائه خدمات، به کمک نمودارهای کنترل کیفی در SPSS، ابزاری برای کارشناسان و کسانی است که در قسمت کنترل کیفی شرکت‌ها، فعالیت دارند. به علاوه، به دست آوردن معیارهای شناخت داده‌ها مانند شاخص‌های آماری (میانگین و واریانس) از یک طرف و روال اجرای کنترل فرایند، از دیگر محاسباتی است که SPSS به خوبی از عهده آن بر می‌آید. نحوه تعریف متغیرها و انواع داده ها در SPSS برای فرآیند کنترل کیفی نیز در این آموزش یادآوری شده است.

این آموزش، شامل ۱ ساعت و ۵۵ دقیقه محتوای ویدیویی است که طی آن به مواردی مطابق با فهرست زیر، مورد بحث قرار می‌گیرد.

  • درس اول: کنترل کیفیت و رسم نمودارهای کنترل متغیرهای کمی: این بخش شامل مواردی مانند مفاهیم و کاربردهای شاخص های آماری، تعیین حدود کنترل، تعیین الگوها کنترل فرآیند، نمودار Xbar و R، نمودار Xbar و S، همینطور نمودار اندازه های مجزا با دامنه متحرک (Individual – Moving Range) است.
  • درس دوم: رسم نمودارهای کنترل کیفی متغیرهای کیفی و شاخص های قابلیت فرایند: این درس، موضوعاتی نظیر، نمودار نسبت اقلام معیوب (P- Chart)، نمودار تعداد اقلام معیوب (Np Chart)، نمودار تعداد نواقص (نمودار U,C) و قابلیت فرایند و شاخص‌های آن (Cp-Cpu Cpl ,Cpk,…) را شامل می‌شود.

مشاهده این فیلم آموزشی را به تمامی کسانی که در رشته صنایع، مهندسی مکانیک و مدیریت فعالیت دارند، توصیه می‌کنیم.

خلاصه و جمع‌بندی

در نهایت می‌توان ارتباط بین متغیرها و انواع داده ها در SPSS را در نموداری که توسط تصویر نمایش داده شده، مشاهده کرد. در کنار هر یک از گزینه‌های انتهایی برای متغیرهای کیفی، مثالی نیز در این تصویر آورده شده است. البته به یاد داشته باشید که مقیاس نسبی و فاصله‌ای هر دو در SPSS به صورت Scale به کار می‌روند و متغیرهای کیفی با مقیاس Nominal و Ordinal تعیین می‌شوند.

scales of measurement
تصویر 7: ارتباط بین متغیر و انواع داده ها در SPSS

تعیین نوع داده ها در SPSS اهمیت خاصی بخصوص هنگام ورود مقادیر، دارد. اگر نوع مقیاس (Measure) برای آن‌ها به درستی تعیین نشده باشد، ممکن است در بعضی از موارد و تحلیل‌هایی که توسط نرم‌افزار SPSS انجام‌ می‌دهید با مشکل برخورد کنید. برای مثال اگر نوع مقیاس داده‌ای به صورت Scale انتخاب شده و در رسم نمودار ستونی (Column) به عنوان مقادیر محور افقی ظاهر شود، SPSS، نمودار مناسبی ایجاد نخواهد کرد و نمی‌تواند تشخیص دهد که می‌خواهید سطوح یک متغیر را در محور افقی قرار دهید. به این منظور، تعیین مقیاس‌های اندازه‌ برای متغیرهای در SPSS بسیار مهم جلوه کرده و باعث سرعت و صحت در انجام کارها می‌‌شود.

اگر این مطلب برای شما مفید بوده است، آموزش‌ها و مطالب زیر نیز به شما پیشنهاد می‌شوند:

بر اساس رای ۶ نفر
آیا این مطلب برای شما مفید بود؟
شما قبلا رای داده‌اید!
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

3 نظر در “انواع داده ها در SPSS — راهنمای کاربردی

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد.

مشاهده بیشتر