پایایی و روایی پرسشنامه — انواع روش ها با مثال
هنگامی که با یک مسئله روبرو میشوید، برای شناخت آن باید به جمعآوری داده و اطلاعات بپردازید. معمولا این کار در حوزه علوم اجتماعی به واسطه پرسشنامه یا فرمهای نظرسنجی صورت میگیرد. ولی آیا واقعا نتایج حاصل از پرسشنامهها معتبر است؟ آیا سوالات به شکلی تنظیم شدهاند که افراد برداشتی مشابه از آنها داشته باشند؟ اگر پرسشنامه را در دو زمان متفاوت به فرد پاسخدهنده ارائه کنیم، جوابهای یکسانی دریافت میکنیم؟ این سوالات در هر طرح تحقیقی مطرح شده و محقق باید برای آنها، پاسخهای قانع کنندهای ارائه کند. اندازههای پایایی و روایی پرسشنامه روشی است که اغلب برای پاسخ به چنین سوالاتی، مطرح شده و مورد ارزیابی قرار میگیرد. در صورتی که پایایی و روایی پرسشنامه مطلوب نباشند، نمیتوان به نتایج بدست آمده از طرح «تحقیق پرسشنامهای» (Questionnaire) نیز اعتماد داشت.
در این متن برای انجام محاسبات و اجرای عملیات، از نرمافزار اکسل و قدرت فرمولنویسی و توابع آن کمک خواهیم گرفت. در این نوشتار از مجله فرادرس با اصطلاحاتی آشنا خواهید شد که در دیگر نوشتارها نیز مطرح گردیده، بنابراین به عنوان پیشنیاز، بهتر است مطالب فرمول نویسی در اکسل — به زبان ساده و سنجش پایایی پرسشنامه با آلفای کرونباخ — شیوه محاسبه را مطالعه فرمایید. همچنین خواندن ضریب همبستگی (Correlation Coefficients) و شیوه محاسبه آنها — به زبان ساده و روش تحقیق علمی — راهنمای کاربردی نیز برای روشن شدن نحوه محاسبه یا استفاده از پایایی و روایی پرسشنامه نیز پیشنهاد میشود.
پایایی و روایی پرسشنامه
برای اینکه یک «پرسشنامه» (Questionnaire) قابل قبول شناخته شود، باید دارای دو ویژگی بسیار مهم باشد که عبارتند از قابلیت اطمینان یا پایایی و روایی. اولی سازگاری پرسشنامه را اندازه گیری میکند در حالی که دومی میزان مطابقت نتایج حاصل از پرسشنامه با دنیای واقعی را تعیین مینماید. پایایی و روایی پرسشنامه دو ویژگی بسیار مهم در یک تحقیق مبتنی بر پرسشنامه هستند.
روشهای آماری مختلفی برای اندازهگیری قابلیت اطمینان و روایی پرسشنامه شما وجود دارد. انتخاب نوع تکنیک آماری برای تجزیه و تحلیل دادهها، اغلب به طراحی و هدف پرسشنامه بستگی دارد.
همانطور که در تصویر ۱ مشاهده میکنید، یک سیبل یا هدف نمایش داده شده که قرار است به مرکز آن شلیک شود. هر کدام از سیبلها، یک نوع از ترکیب صحت و دقت را نمایش دادهاند. از راست به چپ، اولین سیبل و نتایج شلیک، دقت و صحت زیاد را نشان میدهد. سیبل دوم نیز نشانگر صحت مناسب ولی دقت کم است. سومین سیبل هم دارای دقت زیاد ولی صحت کم است و در آخر، دقت و صحت کم را در سیبل انتهایی شاهد هستیم. این تصاویر مقایسه خوبی برای نمایش تفاوت و البته ارتباط بین پایایی و روایی پرسشنامه را نشان میدهند.
در این متن به مقایسه پایایی و روایی پرسشنامه پرداخته و خصوصیات هر یک را بازگو کرده و ارتباط آنها را هم بیان خواهیم کرد. ابتدا به شیوههای مختلف اندازهگیری قابلیت اطمینان پرسشنامه یا همان پایایی میپردازیم، سپس روایی را مشخص خواهیم کرد.
قابلیت اطمینان پرسشنامه
شاخص قابلیت اطمینان به نوعی دقت در اندازهگیری را مشخص میکند. به این معنی که در صورت انجام مجدد مطالعه در همان شرایط، امتیاز یا مقدار حاصل از پرسشنامه، تغییری نخواهد کرد. به این موضوع توجه داشته باشید که در قابلیت اطمینان، صحت (یا مقدار درستی) برای پرسشنامه اندازهگیری نمیشود. در حقیقت صحت به بخش روایی پرسشنامه بستگی دارد که در قسمتهایی بعدی این متن به آن اشاره خواهیم کرد.
شیوههای مختلفی برای اندازهگیری پایایی پرسشنامه وجود دارد که به جنبههای مختلف طرح تحقیق، دسترسی به آزمودنیها و ... بستگی دارد. در ادامه به بعضی از روشها، اشاره خواهیم کرد.
قابلیت اطمینان با تکرار آزمایش
در زمانی که امکان ارائه پرسشنامه به همان گروه از پاسخ دهندگان در چند زمان متفاوت فراهم باشد، از قابلیت اطمینان با روش تکرار آزمایش بهره میبریم. اهمیت این روش آن است که آزمودنیها، با یک سوال در چندین بار، پاسخ میدهند. سپس، مقایسه پاسخها در دو یا چند مقطع زمانی اجرا شده و تفاوتها سنجیده میشوند. اگر بین پاسخها یا نمرات حاصل از پرسشنامه، همبستگی شدید وجود داشته باشد، میتوان نتیجه گرفت که پرسشنامه دارای قابلیت اطمینان مناسب است، زیرا دقت نتایج بدست آمده، زیاد و در حقیقت واریانس یا پراکندگی آنها کم است.
این نوع آزمون قابلیت اطمینان یک اشکال محتوایی دارد که ناشی از اثرات حافظه افراد است. اگر پاسخ دهندگان به سوالات به شکلی پاسخ دهند که اولین بار به آنها پاسخ دادهاند، ممکن است یک اطمینان مصنوعی برای محقق فراهم کنند. بنابراین، برای کاهش اثرات حافظه، باید زمان بین اولین آزمون و آزمایش مجدد افزایش یابد.
البته در اغلب موارد دسترسی به پاسخدهندگان مقدور نیست. به همین دلیل این کار به ندرت قابل اجرا است. ولی معمولاُ در مراحل درمانهای پزشکی و سلامت، از آنجایی که بیمار در بخش بستری است، امکان بررسی پاسخها در دو یا چند دوره وجود دارد. به همین جهت در این حوزه، قابلیت اطمینان پرسشنامهها را به کمک تکرار نیز میتوان انجام داد.
پایایی پرسشنامه با فرمهای موازی
در این حالت، صورتهای مختلفی از یک پرسشنامه به صورت موازی (مثلا A و B) ساخته میشود که هر دو به اندازهگیری یک سازه اختصاص دارند. به این ترتیب قرار است نتایج یکسانی از هر دو پرسشنامه بدست آید ولی توجه داشته باشید که سوالات متفاوت ساخته میشوند.
پاسخ دهندگان باید هر دو فرم پرسشنامه را پر کنند و از یکی بودن آنها خبر ندارند. بر اساس این فرض که هر دو شکل قابل تعویض هستند، همبستگی دو فرم یا پاسخهای پرسشنامهها، پایایی تحقیق را نشان میدهد. باز هم کافی است که ضریب همبستگی بین دو گروه پاسخها را محاسبه کرده و نتایج را گزارش کرد. اگر ضریب همبستگی نمرات پرسشنامهها قابل قبول (بیشتر از ۰٫۷) باشد، شرط پایایی پرسشنامه مورد قبول قرار میگیرد.
از معایب این روش میتوان به هزینه و زمان زیاد برای اندازهگیری پایایی اشاره کرد. معمولا روش دو نیمه سازی میتواند جایگزینی برای این شیوه در نظر گرفته شود. از آنجایی که هر دو روش یاد شده براساس محاسبه ضریب همبستگی، اجرا میشوند، بهتر است، نوشتار دیگر مجله فرادرس با عنوان محاسبه کوواریانس و ضریب همبستگی در اکسل — به زبان ساده را برای بدست آوردن شاخص قابلیت اطمینان یا پایایی را مطالعه کنید. به همین جهت، از نمایش نحوه محاسبه این شاخصها در این بخش، صرف نظر خواهیم کرد.
محاسبه پایایی پرسشنامه با استفاده از آلفای کرونباخ
«آلفای کرونباخ» (Cronbach's Alpha) شاخصی برای اندازهگیری «سازگاری درونی» (Internal consistency) است. از طریق این معیار، میانگین همبستگی سوالات موجود در یک ابزار نظرسنجی را محاسبه کرده و برای سنجش قابلیت اطمینان پرسشنامه مورد استفاده قرار میدهند. بنابراین، آلفای کرونباخ، شاخصی برای قابلیت اطمینان است که با تغییرات مربوط به نمره واقعی «سازه مورد نظر» مرتبط است.
نکته: ممکن است در یک پرسشنامه، بیش از یک سازه مورد بررسی قرار گرفته باشد، به این ترتیب باید برای سوالاتی که هر سازه را میسازند، جداگانه آلفای کرونباخ را محاسبه کرد. به این ترتیب هر سازه، یک آلفای کرونباخ داشته و هر بخش از پرسشنامه، قابلیت اطمینان متفاوتی خواهد داشت.
ضریب آلفا از نظر مقداری در بازه 0 تا 1 است. البته ممکن است که مقادیر منفی برای این ضریب نیز بدست آید، که نشانگر عدم همخوانی پاسخها یا کوواریانس منفی بین آنها است. این امر نشان میدهد که پاسخ دهنده، در پرسشنامه، قاعده مشخصی را رعایت نکرده و پاسخهای متناقض داده است. در صورتی که پاسخها پرسشنامه، تصادفی و مستقل از یکدیگر باشند، مقدار آلفای کرونباخ صفر خواهد شد.
به کمک آلفای کرونباخ میتوان برای توصیف قابلیت اطمینان عوامل استخراج شده از سوالات دو گزینهای نیز استفاده کرد. سوالاتی با دو پاسخ ممکن یا چند پرسشنامه یا مقیاس قالببندی شده چند سطحی (مثل طیف لیکرت) یعنی مقیاس رتبه بندی: 1 = ضعیف ، 5 = عالی؛ برای محاسبه آلفای کرونباخ لازم هستند. بنابراین، هرچه نمره یا مقدار آلفای کرونباخ بالاتر باشد، پرسشنامه، قابل اطمینانتر است. فرمول آماری برای محاسبه قابلیت اطمینان بر حسب «آلفای کرونباخ» به صورت زیر است:
رابطه ۱: فرمول محاسبه آلفای کرونباخ
در این رابطه منظور از ، میانگین مقدارهای کوواریانس گویهها (بدون در نظر گرفتن کوواریانس هر متغیر با خودش) و نیز میانگین واریانس گویهها یا سوالات است. البته توجه داشته باشید که پرسشها یا گویهها را هم جهت در نظر گرفتهایم. به این معنی که مقیاس یا طیف لیکرت برای اندازهگیری هر گویه، برای همه سوالات به یک شکل و یک جهت است. منظور از جهت یکسان آن است که اگر در سوالی مقدار ۱ به معنی کم و ۵ به معنی زیاد است، در بقیه سوالات نیز به همین شکل عمل شده و توالی مقادیر یکسان باشد.
مثال: فرض کنید دو سوال به صورت زیر در پرسشنامه وجود دارد.
- آیا قدردانی از کاری که برای وابستگان انجام دادهاید، برایتان موضوع مهمی است؟
- آیا از اینکه وابستگان نسبت به کارتان، تشویقی انجام دهند، نگران بالا رفتن انتظارتشان میشوید؟
همچنین طیف لیکرت ۵ گزینهای برای هر یک از سوالات را به صورت در نظر بگیرید.
الف- خیلی کم (۱)، ب- کم (۲)، ج- متوسط (۳)، د- زیاد (۴)، ه- خیلی زیاد (۵)
واضح است جهت پاسخ به سوال ۱ با ۲ تفاوت دارد، بنابراین اگر میخواهید امتیاز چنین پرسشنامهای را بدست آورید، باید مقادیر عددی برای پاسخ سوال ۲ را برعکس کنیم یا اینکه مقدارهای عددی برای گزینههای پاسخ در سوال ۲ را از ۶ کم کنیم. بنابراین مقدار امتیاز برای سوال ۲ به صورت زیر درخواهد آمد. به این ترتیب جهت پاسخهای هر دو سوال یکسان خواهد شد.
الف- خیلی کم (۵)، ب- کم (۴)، ج- متوسط (۳)، د- زیاد (۲)، ه- خیلی زیاد (۱)
نکته: واضح است که در صورت استقلال سوالات پرسشنامه، مقدار صورت کسر رابطه ۱، صفر شده و مقدار شاخص آلفا نیز صفر خواهد شد. اگر وابستگی بین سوالات زیاد باشد، صورت و مخرج برابر بوده و با فرض بزرگ بودن تعداد سوالات ()، مقدار شاخص آلفا برابر با ۱ خواهد شد.
آلفا یک مفهوم مهم در ارزیابی پرسشنامهها است. از این رو، مهم است که ارزیابی کنندگان و محققان مقدار آن را برای افزودن اعتبار و دقت به تفسیر دادههای خود تخمین بزنند. با این وجود، آلفا کرونباخ اغلب بدون درک مناسب از آن و به روشی غیر مناسب و بدون درک و تفسیر کافی گزارش میشود.
در این بخش با کمک کاربرگهای اکسل و توابع مربوط به محاسبه واریانس (Variance) و کوواریانس (Covariance)، به اندازهگیری آلفای کرونباخ یا سازگاری درونی برای یک پرسشنامه یا چهار پرسش میپردازیم. به منظور دسترسی به دادههای مورد نظر، بهتر است فایل فشرده شده را از اینجا دریافت کرده، فرمولها و محاسبات مربوط به پایایی و روایی پرسشنامه را مرور کنید.
این کاربرگ اکسل، شامل پاسخهای ۶۰ نفر به چهار پرسش هم جهت است که برای محاسبه پایایی پرسشنامه از آنها استفاده کردهایم. در نظر بگیرید که امتیاز پرسشنامه براساس مجموع پاسخ به هر سوال (Q1 تا Q4) مشخص میشود. ابتدا برای هر یک از متغیرهای که در ستونهای A تا D قرار گرفتهاند، مقدار واریانس در سطر ۶۲ام این کاربرگ محاسبه شده است. همچنین امتیاز پرسشنامه برای هر فرد در ستون (Total) قابل مشاهده است که بوسیله جمعکردن مقادیر طیف لیکرت چهار سوال، بدست آمده. واریانس این ستون نیز در سطر ۶۲ام دیده میشود.
در بخش دیگری از کاربرگ یعنی سطر ۶۴ام، کوواریانس هر متغیر با متغیرهای بعدی دیده میشود. از آنجایی که کوواریانس هر متغیر با خودش، همان واریانس خواهد بود، از محاسبه کوواریانس هر متغیر با خودش، صرف نظر کردهایم. در نهایت طبق رابطه ۱، آلفای کرونباخ مورد محاسبه قرار خواهد گرفت. البته توجه دارید که در اینجا خواهد بود. به این ترتیب پایایی یا سازگاری درونی پرسشنامه با توجه به مقدار آلفای کرونباخ، تقریبا برابر با 0٫84 است که گویای پایایی مناسب برای پرسشنامه است. در تصویر زیر، نتیجه محاسبات را مشاهده میکنید.
همانطور که گفته شد، سازگاری درونی به این معنی است که یک نظر سنجی، پرسشنامه یا آزمون، در واقع دقت در اندازهگیری هدف مورد نظرتان را دارد. هرچه سازگاری درونی بیشتر باشد، میتوانید اطمینان بیشتری داشته باشید که نتایج نظرسنجی یا آزمون قابل اعتماد است. اغلب به منظور نشان دادن میزان اطمینان پرسشنامه بوسیله آلفای کرونباخ، از جدول زیر کمک میگیرند.
جدول ۱: سطوح آلفای کرونباخ و ارزیابی پایایی پرسشنامه
سازگاری درونی پرسشنامه | مقدار ضریب آلفای کرونباخ |
عالی | |
مناسب | |
قابل قبول | |
مشکوک | |
ضعیف | |
غیرقابل قبول |
یکی دیگر از روشهای محبوب برای اندازهگیری سازگاری درونی، علاوه بر محاسبه آلفای کرونباخ، استفاده از قابلیت اطمینان به روش دو نیمه سازی است که در ادامه بحث مربوط به پایایی و روایی پرسشنامه به بررسی آن خواهیم پرداخت.
دو نیمه سازی و پایایی پرسشنامه
یکی دیگر از روشهای اندازهگیری قابلیت اطمینان یا پایایی پرسشنامه، شیوه دو نیمه سازی سوالات است. به این ترتیب به نظر میرسد که با دو گروه پرسشنامه سروکار داریم که هر دو یک سازه را مورد بررسی قرار دادهاند. البته شیوه محاسبه بسیار شبیه با روش فرمهای موازی است ولی برای اجرا این تکنیک، دو پرسشنامه تهیه نمیشود.
در صورتی که بخواهید سازگاری درونی یا داخلی را اندازهگیری کنید، روش قابلیت اطمینان دو نیمه سازی یک روش آسان است اما فقط در صورت وجود دو شرط زیر باید از آن استفاده کرد.
- آزمون دارای تعداد زیادی سوال باشد. قابلیت اطمینان دو بخشی یا دو نیمه سازی در آزمونهایی که تعداد زیادی سوال دارند (به عنوان مثال 100 سوال) بهترین عملکرد را دارد، به این ترتیب عددی که برای همبستگی بین سوالات محاسبه میکنیم قابل اعتمادتر است.
- تمام سوالات مربوط به آزمون یا نظرسنجی، ساختار یا حوزه دانش یکسانی را اندازه بگیرند. اگر یک آزمون خاص چندین ساختار مختلف مانند مهارتهای رهبری، مهارتهای ارتباطی، مهارتهای برنامه نویسی و سایر مهارتهای حرفهای را اندازهگیری کند، بهتر است سوالات مربوط به هر یک از بخشها را از هم جدا کرده، سپس برای هر قسمت، از روش دو نیمه سازی برای اندازهگیری سازگاری درونی، استفاده کرد. علت این امر آن است که انتظار نمیرود، بسیاری از پاسخها مربوط به سازهها، با هم مرتبط باشند.
گامهای مربوط به نحوه اجرای تکنیک دو نیمه سازی برای اندازهگیری پایایی پرسشنامه شامل مراحل زیر است:
- سوالات پرسشنامه را به دو نیمه تقسیم کنید. به عنوان مثال، ممکن است یک نیمه از سوالات با عدد زوج تشکیل شود در حالی که نیمه دیگر از سوالات با شماره فرد ساخته شود.
- هر نیمه از سوالات را به ترتیب به یک فرد اختصاص دهید.
- این کار را برای گروه بزرگی از افراد تکرار کنید.
- همبستگی بین نمرات پرسشنامه هر دو نیمه را پیدا کنید.
هرچه همبستگی بین دو نیمه بیشتر باشد، سازگاری داخلی آزمون یا نظرسنجی نیز بیشتر است. در حالت ایده آل، باید همبستگی بین دو نیمه زیاد باشد. این امر نشانگر آن است که تمام قسمتهای پرسشنامه نتایج یکسانی را اندازهگیری کردهاند.
در فایلی که به همراه این متن در اختیارتان قرار گرفته است، روش دو نیمه سازی در کاربرگ دوم اکسل (sheet2)، محاسبه شده است. از آنجایی که مقدار ضریب همبستگی برای بین دو نیمه سوالات، برابر با ۰٫۷۴ است، میتوان پایایی پرسشنامه را مناسب تشخیص داد.
قابلیت اطمینان دو نیمه سازی اسپیرمن-براون
قابلیت اطمینان دو بخشی یا دو نیمه سازی، به منظور ارزیابی پایایی سازه اصلی پرسشنامه به کار میرود. همانطور که گفته شد، سوالات به دو نیمه تقسیم شده، سپس همبستگی نمرات از دو نیمه محاسبه میشود. برای تبدیل ضریب همبستگی به معیار قابلیت اطمینان و تصحیح ضریب همبستگی، از طریق فرمول «اسپیرمن-براون» (Spearman-Brown) اقدام میشود. نحوه محاسبه این شاخص، طبق رابطه زیر خواهد بود.
رابطه ۲
توجه داشته باشید که در رابطه ۲، همان مقدار قابلیت اطمینان دو بخشی اسپیرمن-براون است. همچنین نماد ، «ضریب همبستگی پیرسون» (Pearson Correlation) بین نمرات گروه اول و دوم پرسشنامه را مشخص میکند.
در حقیقت، فرمولی که «چارلز اسپیرمن» (Charles Spearman) و «ویلیام براون» (William Brown) ارائه کردهاند، ضریب همبستگی را به قابلیت اطمینان تبدیل میکند. این دو دانشمند در دو مکان مختلف ولی در یک زمان به بررسی پایایی و روایی پرسشنامه پرداخته و شاخص مربوط به رابطه ۲ را معرفی کردند. واضح است که به علت آنکه ضریب همبستگی مقداری بین ۱- تا ۱ است، مقدار قابلیت اطمینان اسپیرمن-براون، از صفر بزرگتر و از یک نیز کوچکتر خواهد بود، زیرا فقط مقادیر مثبت (قدر مطلق) ضریب همبستگی به کار میآید. بزرگ بودن این مقدار، نشانگر قوی بودن قابلیت اطمینان و کوچک بودن آن، نشانگر ناسازگاری درونی پرسشنامه خواهد بود.
باز هم بوسیله کاربرگ دوم ارائه شده در این متن، شاخص سازگاری درونی اسپیرمن-براون، محاسبه شده و مقداری برابر با ۰٫۸۵ دارد که باز هم دلیلی دیگر برای نمایش پایایی پرسشنامه مورد نظر است. به تصویر ۳ دقت کنید.
یک اشکال مهم در این روش آن است که فقط برای مجموعه بزرگی از سوالات پاسخ مناسب ایجاد میکند (آزمون 100 نمره ای توصیه می شود). از طرفی باید توجه داشت که سوالات باید یک سازه را اندازهگیری کنند. به عنوان مثال، یک پرسشنامه شخصیت، همزمان ممکن است ویژگیهای «درون گرایی»، «برون گرایی»، «افسردگی» و انواع دیگر ویژگیهای شخصیتی را اندازهگیری میکند. بنابراین در چنین حالتی نمیتوان از تکنیک دو نیمه سازی برای اندازهگیری پایایی استفاده کرد.
تفاوت با فرمهای موازی
قابلیت اطمینان دو نیمه سازی مانند قابلیت اطمینان فرمهای موازی است که از یک مجموعه سوالات به دو مجموعه معادل تقسیم میشود. در فرمهای موازی این مجموعهها به پاسخدهندگان یکسان داده میشوند و معمولاً در یک بازه زمانی کوتاه، مثلا در روز دوشنبه و جمعه پرسشنامهها جمعآوری میشوند.
ولی در زمان اندازهگیری قابلیت اطمینان دو بخشی یا دو نیمه سازی، دو گروه مورد بررسی قرار گرفته و هر گروه فقط به یک پرسشنامه پاسخ میدهند و لازم نیست که دو مجموعه مورد بررسی، معادل باشند.
روایی پرسشنامه
قبلا اشاره کردیم که پایایی و روایی پرسشنامه دو مقوله مرتبط ولی جدا از هم هستند. روایی، دقت و روایی صحت ویژگی مورد نظر برای اندازهگیری توسط پرسشنامه را مشخص میکنند. روایی پرسشنامه در حقیقت، توافق نتایج و نتیجه گیریهای حاصل از پرسشنامه تحقیق با دنیای واقعی را اندازهگیری میکند.
برای روشن شدن موضوع تفاوت پایایی و روایی پرسشنامه، یک دستگاه ترازو را در نظر بگیرید که قرار است برای اندازهگیری وزن اجسام به کار رود. منظور از دقت کار ترازو، آن است که با تکرار اندازهگیری، نتایج حاصل، به یکدیگر نزدیک باشند. این همان پایایی برای پرسشنامه است. یعنی با تکرار جمعآوری دادهها توسط پرسشنامه، به نتایج یکسانی برسیم. همانطور که دیدیم، سازگاری درونی نیز یک راهکار برای مشخص کردن این موضوع است.
حال فرض کنید که ترازو را برای اندازهگیری اجسام استاندارد، به کار بردهایم. به این ترتیب انتظار داریم، اگر ترازو سالم باشد، مقدار صحیح را برای وزن آنها نشان دهد. این وضعیت صحت اندازهگیری را نشان میدهد که در بحث پرسشنامه، به روایی شناخته میشود. در حقیقت میخواهیم بدانیم که سوالات پرسشنامه، واقعا ما را به اندازهگیری چیزی که مورد نظرمان هست، هدایت میکنند یا سوالات قابلیت اندازهگیری موضوع مورد بحث را ندارد.
معمولا با دو نوع روایی سروکار داریم، «روایی صوری» (Face validity) و «روایی محتوایی» (Content validity). روایی صوری و روایی محتوا دو شکل اعتبار هستند که معمولاً به صورت کیفی ارزیابی میشوند. اگر از نظر پاسخ دهندگان، سوالات پرسشنامه توانسته باشد ویژگی مورد نظر را به درستی اندازهگیری کند، یک نظرسنجی معتبر از لحاظ صوری، شکل گرفته است.
یک نظرسنجی دارای اعتبار محتوایی است، اگر از نظر متخصصان (به عنوان مثال، متخصصان بهداشت برای نظرسنجیهای بیماری)، سوالات به کار رفته در پرسشنامه تمام جنبههای سازه مورد نظر را پوشش دهد.
روایی صوری نشانگر نظرات ذهنی افراد غیر متخصص و و روایی محتوایی بیانگر اعتماد خبرگان به سوالات مطرح شده است. اعتبار صوری غالباً به عنوان ضعیفترین شکل اعتبار شناخته میشود و معمولاً مطلوب است که بررسی شما علاوه بر اعتبار صوری و محتوایی، معیارهای دیگری ارزیابی پرسشنامه (مانند پایایی) را هم داشته باشد.
روایی صوری
همانطور که گفته شد، روایی صوری به منظور توافق بر پرسشنامه برای اندازهگیری موضوع مورد بررسی است. به عنوان مثال، آزمایشی برای سنجش اینکه آیا دانش آموزان میتوانند ضرب را انجام دهند، تشکیل شده. دانش آموزان به عنوان پاسخدهندگان میدانند کسی که نمره بیشتری گرفته، در مهارت ضرب کردن، تخصص بیشتری دارد.
معمولا از شبیه سازی برای ارزیابی روایی صوری نیز استفاده میشود. در شبیه سازی، اولین هدف طراح سیستم، ساخت سیستمی است که بتواند وظیفه انجام شده را پشتیبانی کند و عملکرد وظیفه فراگیر را برای هر آزمایش خاص ضبط کند. وظیفه یا عملکرد روی شبیهساز باید نمایانگر دنیای واقعی باشد که آنها را مدلبندی کرده است.
روایی صوری معیاری ذهنی برای میزان منطقی به نظر رسیدن این انتخاب است، یعنی از نظر ذهنی برای یک متخصص فقط پس از بررسی سطح محتوا میتوان روایی پرسشنامه را تایید کرد. در نتیجه پرسشنامه مورد نظر دارای روایی صوری است.
روایی محتوا
در روان سنجی، روایی محتوا که گاهی به عنوان اعتبار منطقی نیز شناخته میشود، به میزان انطباق یک اندازه با تمام وجوه یک سازه معین اشاره دارد. به عنوان مثال، اگر در پرسشنامهای ادعا شود که شاخص افسردگی را اندازه گرفته ولی فقط بعد عاطفی افسردگی را ارزیابی کند اما بعد رفتاری را در نظر نگیرد، ممکن است اعتبار محتوایی مناسبی نداشته باشد.
روایی محتوا با روایی صوری متفاوت است. روایی صوری ارزیابی میکند که آیا آزمون از نظر پاسخدهندگان، معتبر به نظر میرسد. در حالی که اعتبار محتوا مستلزم استفاده از متخصصان موضوعی شناخته شده برای ارزیابی این است که آیا موارد پرسشنامه، محتوای تعریف شده را به درستی انداز گرفته است. برای مثال با مشاهده آزمون ضرب، معلمان و متخصصین ریاضیات، همگی اتفاق نظر پیدا میکنند، کسی که قادر به ضرب کردن باشد، باید بتواند به سوالات پاسخ داده و نمره قابل قبولی دریافت کند. این موضوع روایی محتوا را نشان میدهد.
انواع دیگری از روایی نیز وجود دارد که به بررسی متغیرهای پنهان میپردازد. برای اطلاع بیشتر در این زمینه میتوانید به مطلب متغیر پنهان در مدل ساختاری — به زبان ساده مراجعه کنید.
رابطه بین روایی و پایایی پرسشنامه
در حالی که پایایی و روایی پرسشنامه دو کیفیت یا اندازه متفاوت هستند، اما ارتباط تنگاتنگی با هم دارند. در بحث اعتبار تحقیق، پایایی و روایی پرسشنامه باید گزارش شده و نسبت به مناسب بودن آنها، اتفاق نظر وجود داشته باشد.
یک نظرسنجی میتواند از قابلیت اطمینان بالایی برخوردار باشد اما از اعتبار پایین رنج ببرد. یک نظر سنجی یا هر ابزار اندازهگیری ممکن است یک ویژگی اشتباه را با دقت اندازهگیری کند. به عنوان مثال میتوان به ساعتی اشاره کرد که 10 دقیقه سریع کار میکند. بنابراین زمان را با دقت نشان میدهد ولی صحت آن کم است و همیشه برای پیدا کردن زمان واقعی لازم است که ساعت نمایش داده شده را ده دقیقه کمتر در نظر گرفت.
با این وجود، برای اینکه یک نظر سنجی یا ابزار اندازه گیری از اعتبار بالایی برخوردار باشد، باید از قابلیت اطمینان بالایی نیز داشته باشد. بدون قابلیت اطمینان خوب، یک نظر سنجی به درستی آنچه را که برای اندازه گیری در نظر گرفته شده است مشخص نمیکند. قابلیت اطمینان یک شرط لازم اما کافی برای اعتبار نیست. بنابراین پایایی و روایی پرسشنامه دو بازوی مکمل در یک طرح تحقیقی محسوب میشوند.
خلاصه و جمعبندی
همانطور که در این متن خواندید، دو شاخص یا معیار اندازهگیری اعتبار برای شروع یک طرح تحقیقی یا مطالعات زمینهای، به صورت پایایی و روایی پرسشنامه مطرح شد. از آنجایی که «پرسشنامه» (Questionnaire) به عنوان ابزاری برای جمعآوری دادهها، مطرح شده است، صحت اندازههای تهیه شده توسط آن، از اهمیت زیادی برخودار است. پایایی از طرفی دقت اندازهگیری پرسشنامه و روایی، صحت آن را مورد بررسی قرار میدهد. در صورتی که این دو شاخص، برای سوالات یک پرسشنامه، مقدار مناسب و موثری تلقی شوند، میتوان به نتایج حاصل از طرح تحقیقی نیز اعتماد کرد. در حقیقت گامهای اولیه یک روش علمی برای طرح تحقیق، اندازهگیری صحت و دقت یا همان پایایی و روایی پرسشنامه یا سوالات است که باید توسط محقق صورت گرفته و پس از آن، مراحل بعدی را آغاز کند.
زمانی که یه سوال داشته باشیم پایایی چطور سنجیده میشه؟
سلام
این که یک سوال واحد را در دو بعد پرسشنامه قرار دهیم یعنی یک مرتبه برای یک بعد و مرتبه دیگر برای بعد دیگر مورد محاسبه قرار گیرد کار اشتباهی است؟
لازمه ذکر کنم من قصد ندارم اعتبار سازه را بسنجم
سلام وقت به خیر. برای سنجش روایی سرمایه اجتماعی استفاده از تحلیل عاملی یا سازه موثر تر است؟ممنون میشم توضیح بدهید.
با سلام از مطالب مفید شما آیا شما اگه پرسشنامه ای براتون ارسال کنیم پایایی و روایی اون رو برامون حساب میکنید؟؟؟
سلام و درود،
نحوه محاسبه پایایی و روایی به شیوههای مختلف صورت میگیرد ولی برای محاسبه آلفای کرنباخ به نوشتار سنجش پایایی پرسشنامه با آلفای کرونباخ — شیوه محاسبه مراجعه کنید. در این مطلب نحوه محاسبه به کمک نرمافزار SPSS آموزش داده شده.
تندرست و پیروز باشید.