تفکیک فایل داده در SPSS‌ — به زبان ساده

۱۷۵۲ بازدید
آخرین به‌روزرسانی: ۱۰ خرداد ۱۴۰۲
زمان مطالعه: ۱۳ دقیقه
تفکیک فایل داده در SPSS‌ — به زبان ساده

امکانات محاسباتی رایانه‌ها و همچنین سرعت آن‌ها در حال افزایش است. به همین جهت، شیوه‌های محاسباتی نیز تغییر یافته و در نرم‌افزارهای محاسباتی به روز می‌شوند. شرکت IBM که در چند سال اخیر نرم‌افزار محاسبات آماری SPSS را خریداری کرده است، با استفاده از افزونه‌های پایتون در SPSS محیطی را فراهم کرده است که بتوان این به روزرسانی را سریع‌تر و البته راحت‌تر انجام داد. برای مثال در نسخه ۲۶ این نرم‌افزار ابزارهایی وجود دارد که امکان اجرای برنامه‌های نوشته شده به زبان پایتون را امکان‌پذیر می‌سازد. اغلب این دستورات در فهرست گزینه‌های SPSS با علامت $$\color{blue}{\boxed{+}}$$ مشخص شده‌اند. در این نوشتار با سه ابزار آشنا می‌شویم که به منظور تفکیک فایل داده در SPSS‌ استفاده شده و باعث می‌شوند که تحلیل روی گروه خاصی از مشاهدات صورت گیرد. در این میان فقط یکی از این ابزارها است که در نسخه ۲۶ این نرم‌افزار اضافه شده است و برای تفکیک فایل داده در SPSS‌ کارایی بسیار خوبی نیز دارد. متاسفانه برای استفاده از آن در نسخه‌های قبلی لازم است که برنامه مورد نظر را از سایت شرکت IBM دریافت کرده و به صورت یک افزونه از آن بهره بگیرید.

به منظور آشنایی بیشتر با نحوه به کارگیری دستورات و ابزارهای پایتون در SPSS بهتر است مطلب افزونه های پایتون در SPSS – راهنمای کاربردی و همچنین پایتون در SPSS — راهنمای گام به گام را مطالعه کنید. از طرفی خواندن نوشتارهای انجام عملیات تکراری با پایتون در SPSS — راهنمای گام به گام و پنجره ویرایشگر داده (Data Editor) در SPSS — راهنمای کاربردی نیز خالی از لطف نیست.

تفکیک فایل داده در SPSS‌

در نرم‌افزار SPSS، مجموعه داده (Dataset) به جدولی گفته می‌شود که شامل اسامی متغیرها و مقادیر آن‌ها است. معمولا یک مجموعه داده، جدولی است که سطرها نمایانگر مشاهدات (Cases) و ستون‌ها نیز متغیرها (Variables) را نشان می‌دهد. نوع متغیرها در نرم‌افزار SPSS یا به صورت کمی (Quantitative) است یا کیفی (Qualitative). البته متغیرهای کیفی به دو دسته اسمی (Nominal) و ترتیبی (Ordinal) طبقه‌بندی و متغیرهای کمی نیز با مقیاس (Scale) در SPSS شناخته می‌شوند.

اغلب از متغیرهای اسمی و ترتیبی برای تفکیک جامعه آماری و یا نمونه‌ها استفاده می‌شود. به این ترتیب ممکن است گاهی اوقات آن‌ها را متغیرهای طبقه‌ای (Categorical Variable) نیز بنامیم. بر همین اساس می‌توانیم تحلیل‌ها را برای دسته‌های خاصی از جامعه آماری به تفکیک انجام دهیم. برای تفکیک فایل داده در SPSS‌ به بخش‌های جداگانه روش‌های مختلفی وجود دارد. در این نوشتار به بررسی سه روش عمده در این مورد می‌پردازیم. این روش‌ها در فهرست زیر معرفی شده‌اند.

  1. انتخاب مشاهدات: به کمک دستور Select Cases قادر هستیم که بعضی از مشاهدات را انتخاب کرده و محاسبات و تحلیل‌های آماری را روی این گروه خاص اجرا کنیم.
  2. تعیین متغیر تفکیکی: به کمک دستور Split File، از یک یا چند متغیر طبقه‌ای برای تفکیک جامعه استفاده کرده و می‌توانیم با یکبار اجرای دستورات تحلیلی، برای همه گروه‌های تفکیک شده، نتایج تحلیل‌ها را بدست آوریم.
  3. تفکیک فایل داده: روش دیگر، تفکیک مجموعه داده به چندین فایل است که با دستور Split Into Files صورت می‌گیرد. در نتیجه می‌توان روی هر یک از مجموعه داده‌ها، تحلیل یا روش خاصی را اجرا کرد.

مجموعه داده‌ای را در نظر بگیرید که شامل دو متغیر طبقه‌ای (کیفی) و یک متغیر کمی (Scale) است. برای مثال ممکن است این فایل، شامل اطلاعات مربوط به درآمد افراد با متغیر income به عنوان متغیر کمی و متغیرهای وضعیت اشتغال (بازنشسته و شاغل) به همراه جنسیت (زن یا مرد) به عنوان متغیرهای کیفی باشند. چنین فایلی را در تصویر زیر مشاهده می‌کنید. البته برای دریافت فایل مورد نظر بهتر است اینجا کلیک کنید. فایلی که دریافت خواهید کرد به صورت فشرده (Zip) است. در صورتی که فایل را از حالت فشرده خارج کنید، به مجموعه داده با قالب پرونده اطلاعاتی SPSS به نام main.sav خواهید رسید.

data view
برگه نمایش داده‌ها Data View

در تصویر زیر نحوه معرفی این متغیرها نیز نمایش داده شده است.

define variables
تعریف متغیرها در Variable View

قرار است میانگین درآمد را برای گروه‌های بازنشسته و شاغل و همچنین زن و مرد محاسبه و به عنوان خروجی در پنجره Output نمایش دهیم. این کار را به کمک روش‌های تفکیکی که در بالا به آن اشاره شد انجام خواهیم داد.

نکته: اگر بخواهید به جای نمایش مقادیر، برچسب‌های تعریف شده برای هر یک از مقادیر متغیرهای Gender و status را نمایش دهید باید از فهرست View گزینه Value Labels را انتخاب کنید.

انتخاب مشاهدات با Select Cases

برای دسترسی به دستور انتخاب مشاهدات، از فهرست Data گزینه Select Cases را انتخاب می‌کنیم. پنجره‌ای به صورت زیر ظاهر می‌شود.

select cases in SPSS
پنجره انتخاب مشاهدات، Select Cases

در قسمت چپ، لیست متغیرهای موجود در مجموعه داده نمایش داده است. در قسمت سمت راست این پنجره نیز نحوه انتخاب مشاهدات مشخص شده است. در فهرست زیر به معرفی این گزینه‌های کادر Select خواهیم پرداخت.

  1. گزینه All cases: همه مشاهدات در محاسبات و تحلیل‌های آماری به کار گرفته می‌شوند.
  2. گزینه if condition is satisfied: با انتخاب این گزینه برای مشخص کردن مشاهداتی که باید در تحلیل‌های آتی در نظر گرفته شوند از یک عبارت شرطی استفاده می‌شود. هر مشاهده‌ای که شرط گفته شده برایش صادق باشد، انتخاب شده و برای انجام تحلیل‌های بعدی SPSS از آن‌ها بهره می‌برد. این شرط می‌تواند براساس یک یا چند متغیر نوشته شود. حتی می‌توان براساس مقدارهای یک متغیر طبقه‌ای نیز مشاهدات را برای انتخاب محدود کرد.
  3. گزینه Random sample of cases: انتخاب یک نمونه تصادفی از مجموعه داده موجود توسط این گزینه صورت می‌گیرد. اگر بخواهیم به طور تصادفی یک نمونه از مشاهدات موجود ایجاد کنیم، این گزینه بهترین روش خواهد بود.
  4. گزینه Based on time or case range: اگر لازم است که دنباله‌ای خاصی از مشاهدات انتخاب شوند این گزینه کار ساز است. برای مثال ممکن است بخواهیم برای انجام تحلیل فقط از مشاهدات ۱۰ تا ۱۰۰ مورد استفاده قرار گیرند. به این ترتیب با ذکر این مقادیر، دامنه مشاهدات مورد نظر را محدود خواهیم کرد.
  5. گزینه Use filter variable: به کمک این گزینه و معرفی یک متغیر دو وضعیتی (مثلا با مقدار 0 و 1) همه مشاهداتی که در این متغیر مقداری برابر با صفر دارند کنار گذاشته شده و بقیه مورد استفاده خواهند بود.

نکته: این گزینه‌های به منظور انتخاب مشاهدات مورد نظر به کار می‌روند. اگر لازم باشد که مشاهداتی کنار گذاشته شوند لازم است که شیوه تعریف شرط در گزینه شماره ۲ را به شکلی انتخاب کنیم که به صورت متمم شرط عدم انتخاب نوشته شود.

در کادر Output نیز نحوه رفتار با مشاهدات انتخاب نشده را تعیین می‌کنید. با انتخاب گزینه اول یعنی Filter out Selected cases، نتیجه اجرای دستور Select Cases فقط انتخاب مشاهدات مورد نظر و خط زدن مشاهدات انتخاب نشده خواهد بود. در صورتی که با انتخاب گزینه Copy selected cases to a new dataset، مشاهدات انتخابی در یک مجموعه داده جدید کپی خواهند شد. نام این مجموعه داده جدید را باید در قسمت Dataset name وارد کرده باشید. اگر قصد حذف مشاهدات انتخاب نشده را دارید گزینه آخر یعنی Delete unselected cases را انتخاب کنید. به این ترتیب مشاهدات انتخاب نشده از مجموعه داده جاری حذف خواهند شد. دقت کنید که این کار ممکن است بسیار مشکل‌ساز شود زیرا دسترسی شما را به همه داده‌ها از بین می‌برد.

نکته: در سطر انتهایی این پنجره وضعیت انتخاب مشاهدات مشخص شده است. برای مثال اگر جنسیت مبنای انتخاب مشاهدات باشد، در این بخش نام متغیر Gender نشانگر ویژگی انتخاب مشاهدات برحسب این متغیر است. همچنین با در نظر گرفتن گزینه ۴ از فهرست بالا، شماره مشاهدات انتخاب شده در این قسمت دیده خواهد شد.

باید توجه داشت که هنگام انجام محاسبه متغیر جدید براساس متغیرهای موجود، دستور Select Cases بی‌اثر است و ایجاد مقادیر برای متغیر جدید برای همه مشاهدات انجام می‌شود. در این حالت اگر بخواهیم برای بعضی از مشاهدات خاص، متغیر جدید تعریف شود باید از دستور If در پنجره Compute Variable استفاده کنیم.

مثال

در این قسمت قرار است میانگین درآمد را برای گروه آقایان محاسبه کنیم و نمایش دهیم. همین عمل را هم برای گروه خانم‌ها نیز اجرا خواهیم کرد. پس مشخص است که متغیری که باعث تفکیک مشاهدات خواهد شد، متغیر Gender‌ است. تنظیمات پنجره Select cases را براساس انتخاب گزینه If، مطابق با تصویر زیر در می‌آوریم.

select and if spss
پنجره شرط برای انتخاب مشاهدات

به یاد دارید که مقدار جنسیت برای آقایان با مقدار 1‌ مشخص شده بود. به همین علت در شرط نیز مقایسه مقدار متغیر Gender را با 1 انجام داده‌ایم.

نکته: اگر بخواهید از کدهای برنامه‌نویسی در SPSS برای انجام این امر استفاده کنید باید در پنجره Syntax دستورات زیر را وارد کنید.

1USE ALL. 
2COMPUTE filter_$=(Gender=1). 
3VARIABLE LABELS filter_$ 'Gender=1 (FILTER)'. 
4VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. 
5FORMATS filter_$ (f1.0). 
6FILTER BY filter_$. 
7EXECUTE.

هنگامی که به وسیله دستور Select Cases، مشاهداتی را انتخاب می‌کنید، روی شماره مشاهدات انتخاب نشده در پنجره Data View، خط موربی دیده می‌شود که به معنی کنار گذاشته شدن آن‌ها در تحلیل‌های آتی است.

حال در پنجره Data View دیده می‌شود مشاهداتی که در ستون Gender مقداری برابر با 2 دارند خط خورده‌اند. به این ترتیب فقط مشاهداتی که مربوط به آقایان هستند انتخاب شده‌اند. این وضعیت در تصویر زیر دیده می‌شود. همانطور که مشاهده می‌کنید، یک متغیر جدید به نام $_filter ساخته شده که از نوع متغیرهای سیستم (System Variable) است و نشان می‌دهد که کدام مشاهدات انتخاب شده‌اند. مقدار این متغیر برای مشاهدات انتخاب نشده برابر با صفر (Not Selected) و در غیر اینصورت برابر با 1 (Selected) است.

selected cases and filter variable
نمایش مشاهدات انتخابی به همراه متغیر $_filter

اکنون محاسبه میانگین را به کمک دستور Descriptive انجام می‌دهیم. نتیجه به صورتی که در تصویر زیر دیده می‌شود، خواهد بود.

descriptive statistics
آمارهای توصیفی برای درآمد آقایان

همین عملیات را هم برای خانم‌ها انجام خواهیم داد. دقت کنید که برای انتخاب خانم‌ها در مجموعه داده کافی است که شرط مربوط به جنسیت را براساس مقدار 2 بنویسیم. با اجرای دستور Descriptive آماره‌های توصیفی برای این گروه از مشاهدات ظاهر خواهد شد. واضح است که میانگین درآمد در بین آقایان و خانم‌ها تفاوت دارد.

descriptive statistics-
آمار توصیفی برای درآمد خانم‌ها

نکته: فراموش نکنید پس از انجام تحلیل‌ها، تنظیمات پنجره Select Cases را به حالت عادی در‌ آورید. به این منظور فقط کافی است گزینه اول یعنی All cases را انتخاب و دکمه OK را در پنجره مربوطه کلیک کنید.

تفکیک تحلیل‌ و خروجی‌ها با Split File

شیوه دیگری که برای انجام تحلیل‌های آماری روی دسته‌های مختلفی از مشاهدات وجود دارد، استفاده از دستور Split File‌ از فهرست Data به منظور تفکیک فایل داده در SPSS‌ است. به این ترتیب می‌توانید به منظور مقایسه یا تهیه خروجی جداگانه از محاسبات روی هر دسته‌ای از مشاهدات که توسط یک متغیر طبقه‌ای مشخص می‌شود، از دستور Split File بهره ببرید.

با اجرای این دستور پنجره‌ای به مانند شکل زیر ظاهر می‌شود. باز هم متغیرها در کادر سمت چپ و جزئیات دستور Split File در کادر سمت راست دیده می‌شود.

Split File dialog box SPSS
پنجره تفکیک فایل-Split File

در ادامه به صورت فهرست وار به معرفی گزینه‌های این پنجره خواهیم پرداخت.

  1. گزینه Analyze all cases, do not create groups: انتخاب این گزینه باعث می‌شود که هیچ گونه طبقه و گروه‌بندی صورت نگیرد و تحلیل روی همه مشاهدات انجام شود.
  2. گزینه Compare groups: با انتخاب این گزینه، باید متغیری که وظیفه تفکیک مشاهدات را دارد،‌ در کادر Groups Based on مشخص کنید. برای مثال اگر وضعیت بازنشستگی را در این کادر قرار دهیم، تحلیل بعدی برای هر دو گروه شاغل و بازنشسته انجام شده و به منظور مقایسه نتایج، در هر مرحله یک جدول مقایسه‌ای بین دو گروه تشکیل می‌شود. به این ترتیب برای مثال اگر دستور تهیه جدول و نمودار فراوانی را داده‌اید و متغیر وضعیت بازنشستگی را به عنوان متغیر تفکیکی معرفی کرده‌اید، ابتدا جدول فراوانی برای گروه شاغل‌ها و بازنشسته‌ها ایجاد شده سپس برای مقایسه نمودار فراوانی این دو گروه هیستوگرام ترسیم می‌شود. پس مشخص است که هر بخش از خروجی برای هر گروه در کنار هم تولید می‌شود.
  3. گزینه Organize output by groups: اگر می‌خواهید برای هر طبقه یا دسته تمامی خروجی‌ها به تفکیک حاصل شود، این گزینه را انتخاب کنید. به این ترتیب برای مثال اگر دستور تهیه جدول و نمودار فراوانی را داده‌اید و متغیر وضعیت بازنشستگی را به عنوان متغیر تفکیکی معرفی کرده‌اید، ابتدا جدول و نمودار فراوانی برای گروه شاغل‌ها ایجاد شده سپس برای گروه بازنشسته‌ها جدول و نمودار ترسیم می‌شود. پس مشخص است که همه بخش‌های خروجی برای هر گروه جداگانه تولید و نمایش داده می‌شود.
  4. گزینه Sort the file by grouping variables: فعال بودن این گزینه باعث می‌شود که مجموعه داده براساس متغیری که در قسمت Groups Bases on معرفی شده، مرتب شود. به این ترتیب اگر متغیر وضعیت بازنشستگی برای تفکیک معرفی شده باشد، در پنجره Data View ابتدا مشاهداتی که مربوط به شاغلین است ظاهر شده سپس افراد بازنشسته دیده می‌شوند. به این ترتیب نظم ورود داده‌ها تغییر خواهد یافت و مشاهدات نسبت به شماره ردیف‌ها جابجا خواهند شد.
  5. گزینه File is already sorted: ممکن است بخواهید که نظم که قبلا برای مشاهدات در نظر گرفته‌اید تغییر نکند. به همین علت کافی است با انتخاب این گزینه، از مرتب‌سازی مجموعه داده توسط متغیر طبقه‌ای در SPSS جلوگیری کنید. به این ترتیب نظم مجموعه داده به حالت اولیه خود حفظ خواهد شد و مشاهدات نسبت به شماره ردیف‌ها جابجا نخواهند شد.

نکته: توجه داشته باشید که می‌توان بیش از یک متغیر تفکیکی را در کادر Groups Based on قرار داد. به این ترتیب به ازاء هر سطح از متغیرهای طبقه‌ای خروجی جداگانه‌ای تولید خواهد شد. این کار برای مقایسه‌‌های ترکیبی مناسب است. برای مثال اگر جنسیت و وضعیت بازنشستگی را در این کادر قرار دهیم، خروجی‌ها شامل میانگین درآمد خانم‌های بازنشسته، خانم‌های شاغل، آقایان بازنشسته و آقایان شاغل خواهد بود.

در انتهای این پنجره نیز وضعیت به کارگیری دستور Split File مشخص شده است. اگر متغیر یا متغیرهایی در کادر Groups Based on قرار گرفته باشند، نام آن‌ها در این قسمت دیده می‌شود.

split shown in status bar of SPSS data Editor
نمایش وضعیت تفکیک فایل

به منظور تفکیک فایل به کمک دستورات SPSS کافی است در پنجره Syntax کدهایی به مانند زیر را وارد و اجرا کنید.

1DATASET ACTIVATE DataSet1. 
2SORT CASES  BY Gender status. 
3SPLIT FILE LAYERED BY Gender status.

مثال

در این قسمت قرار است میانگین درآمد را برای گروه‌های خانم‌ها و آقایان به تفکیک وضعیت بازنشستگی محاسبه و نمایش دهیم. پس مشخص است که متغیری که باعث تفکیک مشاهدات خواهد شد، متغیر Gender‌ و status است. تنظیمات پنجره Split File را مطابق با تصویر بالا انجام داده‌ایم. حال در نوار وضعیت پنجره Data View دیده می‌شود که مشاهدات براساس این دو متغیر تفکیک شده‌اند.

نکته: توجه داشته باشید که متغیرهایی که در کادر Groups Based on به کار رفته‌اند در هیچ تحلیل دیگری مورد استفاده قرار نگیرند زیرا شما آن‌ها را مبنای طبقه‌بندی در نظر گرفته‌اید و SPSS قادر به محاسبه براساس آن‌ها نیست.

اکنون محاسبه میانگین را به کمک دستور Descriptive انجام می‌دهیم. نتیجه به صورتی که در تصویر زیر دیده می‌شود، خواهد بود.

Descriptive Statistics with Split File
آمار توصیفی برای ترکیب گروه‌های زنان و مردان با وضعیت بازنشستگی

این طور به نظر می‌رسد که میانگین در‌آمد بازنشسته‌ها هم در گروه آقایان و هم خانم‌ها از شاغلین کمتر است. ولی در بین گروه شاغلین متوسط درآمد خانم‌ها تقریبا دو برابر آقایان است.

نکته: از آنجایی که حجم نمونه کم بوده و داده‌های به صورت تصادفی تولید شده‌اند ممکن است نتایج حاصل با واقعیت هم‌خوانی نداشته باشد.

تفکیک فایل داده یا دستور Split info Files

آخرین ابزار و روشی که برای تفکیک مجموعه داده پیشنهاد می‌کنیم، تفکیک آن‌ها در فایل‌های مجزا با دستور تفکیک فایل داده در SPSS‌ است. به این ترتیب برای هر یک از گروه‌هایی که توسط ترکیب سطوح مختلف متغیرهای طبقه‌ای بوجود می‌آید، فایل‌های جداگانه ساخته خواهد شد.

برای دسترسی به این دستور کافی است از فهرست Data گزینه Split into Files را انتخاب کنید. به این ترتیب پنجره‌ای مانند تصویر زیر ظاهر خواهد شد. در کادر سمت چپ یعنی Variables اسامی متغیرهایی که برای تفکیک مناسب هستند ظاهر شده است.

نکته: در این لیست خبری از متغیر income نیست، زیرا این متغیر از مقیاس (Scale) بوده و برای طبقه‌بندی و گروه‌بندی مشاهدات مناسب نیست. واضح است در اینجا که فقط متغیرهایی از نوع اسمی (Nominal) یا ترتیبی (Ordinal) مناسب بوده و در این لیست ظاهر می‌شوند.

Split Into Files in SPSS
پنجره تفکیک داده‌ها در SPSS به چندین پرونده با دستور  Split into Files

متغیرهایی که برای تفکیک فایل داده در SPSS‌ لازم هستند را در کادر Split Cased by قرار دهید. توجه دارید که در این قسمت می‌توان بیش از متغیر طبقه‌ای را هم قرار داد. البته متغیرهایی که از نوع عددی هستند، باید شامل عددهای صحیح باشند.

در کادر Output Location با انتخاب گزینه (Write output files to indicated directory (choose below محلی را که به عنوان پوشه ذخیره‌سازی فایل‌هایی اطلاعاتی جدید است، در کادر Output File Directory مشخص می‌کنید. برای این کار می‌توانید از دکمه Browse هم کمک بگیرد. با انتخاب گزینه Write output to a new temporary directory، محل و نام فایل‌های حاصل از تفکیک مجموعه داده طی گزارشی توسط SPSS برایتان ظاهر می‌شود.

کد اجرایی برای انجام دستور Split into Files مطابق با تصویر بالا در ادامه دیده می‌شود. کافی است که این دستورات را در پنجره Syntax وارد و اجرا کنید. البته دقت داشته باشید که محل قرارگیری فایل‌های ایجاد شده در پوشه Desktop تعیین شده است.

1SPSSINC SPLIT DATASET SPLITVAR=Gender status
2/OUTPUT DIRECTORY= "C:\Users\...\Desktop" DELETECONTENTS=NO 
3/OPTIONS NAMES=LABELS.

نکته: اگر گزینه Delete existing sav files form target directory را انتخاب کنید، فایل‌های اطلاعاتی از نوع sav که در داخل پوشه مورد نظر هستند، پاک خواهند شد. انتخاب این گزینه زمانی مناسب است که محل فایل‌ها را یک پوشه موقت انتخاب کرده باشید و بخواهید با تغییر متغیرهای تفکیک کننده، فایل‌های قبلی از بین بروند.

در قسمت Output File Names، الگویی برای اسامی فایل‌های ایجاد شده برای مجموعه داده‌ها معرفی می‌کنید. در صورتی که در این قسمت چیزی وارد نکنید، اسامی فایل‌های جدید براساس نام متغیرها و برچسب‌هایشان ساخته می‌شود. پسوند sav که برای فایل‌های اطلاعاتی SPSS در نظر گرفته شده است به طور خودکار به اسامی فایل‌ها اضافه خواهد شد.

گزینه Output Listing File به منظور نام‌گذاری برای فایلی متنی است که اسامی فایل‌های تولید شده را به صورت یک لیست در خود نگه می‌دارد. در پنجره Split Dataset into Separated Files به کمک دکمه Options نیز می‌توانید تنظیمات اضافه‌ای را اعمال کنید.

همانطور که مشخص است، در قسمت اول قالب نام‌گذاری فایل‌های خروجی را مشخص می‌کنید. این گزینه‌ها در ادامه فهرست شده‌اند.

  1. گزینه Based on split variable values: با انتخاب این گزینه اسامی فایل‌ها برگرفته از مقادیر یا سطوح متغیرهای تفکیکی خواهد بود. برای مثال اگر قرار باشد که فایلی برای ثبت اطلاعات مشاهدات مربوط به خانم‌ها ایجاد شود، نام فایل با کد 2 شروع خواهد شد.
  2. گزینه Based on split variable value labels: این گزینه باعث می‌شود که به جای مقدار سطوح متغیر تفکیکی از برچسب مقادیر (Value Label) برای نام‌گذاری فایل‌ها استفاده شود. به این ترتیب اسامی فایل‌ها به صورت بازنشسته-آقایان، یا شاغل-خانم‌ها خواهد بود.
  3. گزینه Sequentially numbered: این گزینه باعث می‌شود که فایل‌ها به صورت خودکار و دنباله‌ هم شماره‌گذاری شوند. مشخص است که این شماره‌ها همان نام فایل‌ها خواهد بود.

همچنین با تعیین یک پیشوند برای فایل‌ها در قسمت Name Prefix و انتخاب گزینه Use text as first part of file name، متنی را در کادر Prefix text مشخص می‌کنید. این متن سرنام، اسامی همه فایل‌های ایجاد شده خواهد بود.

براساس تنظیمات انجام شده در این پنجره مطابق با تصویر بالا، خروجی اجرای این فرمان، ایجاد چهار پرونده از اطلاعات با قالب SPSS است که مانند شکل زیر نام‌گذاری شده‌اند. مشخص است که به علت آنکه برچسب مقادیر (Data Value) در پنجره Options انتخاب شده بود،‌ این امر رخ داده است.

Split Into Files output in SPSS
خروجی دستور Split into Files در برنامه SPSS

نکته: این دستور به افزونه برنامه نویسی Python در SPSS احتیاج دارد، می‌توانید این افزونه Python را در سی دی همراه نصب نرم‌افزار SPSS پیدا کنید یا آن را از طریق سایت انجمن SPSS و از اینجا (+) بارگیری کنید. همچنین نحوه نصب افزونه‌های پایتون در SPSS در دیگر نوشتار فرادرس با نام افزونه های پایتون در SPSS – راهنمای کاربردی، آموزش داده شده است.

خلاصه و جمع‌بندی

در این نوشتار با شیوه‌های مختلف تفکیک فایل داده در SPSS‌ به منظور اجرای تحلیل‌های آماری در این نرم‌افزار آشنا شدیم. هر یک از این روش‌ها مناسب برای انجام عملیات خاصی هستند و در نتیجه بهتر است از همه آن‌ها اطلاع داشته باشیم تا به موقع از آن‌ها بهره ببریم. البته در نسخه‌های جدید نرم‌افزار محاسبات آماری SPSS برای ایجاد افزونه‌های جدید به زبان پایتون و R امکاناتی در نظر گرفته شده که کاربر را قادر می‌سازد بنا به نیاز خود، برنامه‌هایی که با آن زبان‌ها نوشته شده را در پنجره‌های SPSS قرار داده و به صورت کامل در دستورات استاندارد SPSS به کار گرفته شوند. برای انجام این کار کافی است از فهرست Extensions گزینه Custom Dialog Builder for Extension را انتخاب کنید و پنجره گفتگوی مخصوص برنامه را به همراه تعریف پارامترها در قالب لیست‌ها و گزینه‌های متعدد، پیاده‌سازی کنید. به این ترتیب به مانند دیگر دستوراتی که در SPSS وجود دارد، برنامه شما هم به کار رفته و حتی می‌توانید برای استفاده دیگران آن را برای دریافت از طریق اینترنت بارگذاری کنید.

اگر علاقه‌مند به یادگیری مباحث بیشتر در مورد SPSS و پایتون هستید، آموزش‌های زیر به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۸ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
مجله فرادرس
۱ دیدگاه برای «تفکیک فایل داده در SPSS‌ — به زبان ساده»

سلام وقت به خیر. برای وارد کردن متغییر وقتی ما گویه داشته باشیم “مثلا وضعیت مسکن دائم رو به گرانی است اما همچنان میتوان خانه خرید و تفاوتی بین کارگر و کارفرما برای خرید خانه وجود ندارد.این ها را چطور برای مورد Name وارد کنیم؟ممنونم

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *