وبلاگ علمی آموزشی
 اعتبار وپایایی آزمون/ مروری بر مطالب

 

مروری بر مطالب گذشته :

ازلحاظ تئوری انحراف معیار توزیع خطاها در هر فرد بزرگی خطای اندازه گیری را نشان می دهد.

اگر پراکندگی اندازه ها حول میانگین خیلی کم باشد در این صورت تعداد بیشتری از نمره های مشاهده شده به نمره واقعی خیلی نزدیک خواهند بود ، همچنین میزان خطای اندازه گیری بوسیله پراکندگی اندازه ها حول نمره واقعی نشان داده می شود.

خطای معیار اندازه گیری همان انحراف معیار خطا است.

آزمون در صورتی دارای اعتبار است که عاری از خطای اندازه گیری غیر نظامدارباشد.

اگر یک آزمون چند بار در مورد یک آزمودنی اجرا شود ونمره وی در همه موارد یکسان باشد نشان دهنده روایی آزمون است ومیزان همبستگی متقابل سؤالات آزمون نشان دهنده همسانی درونی سؤالات است.

وضعیت سلامتی آزمودنی ، از عوامل بیرونی  منابع خطا ، عدم تجانس بین سؤالات ، از عوامل درونی  منابع خطا، ناکافی بودن تعداد سؤالات آزمون از عوامل درونی  منابع خطا و سرد و گرم بودن محل آزمون از عوامل بیرونی  منابع خطا هستند.

در آزمون های شخصیت و مقیاس های نگرش سنج از آلفای کرانباخ اما درآزمون هایی که خصایص مختلف را اندازه گیری می کنند از تحلیل عاملی استفاده می شود.

آزمون های نرم یا گروه مرجع برای اندازه گیری تفاوت های فردی آزمودنی ها در توانایی های شناختی و خصایص عاطفی آن ها به کار برده می شوند.

با استفاده از روش نمونه گیری حیطه می توان  خطای ناشی از عوامل درونی و با استفاده از روش نمونه گیری زمانی می توان  خطای ناشی از عوامل بیرونی را کاهش داد.

اعتبار در الگوی نمونه گیری حیطه، عبارتست از نسبت واریانس بین نمره های مشاهده شده در آزمون کوتاه و واریانس نمره واقعی در آزمون بلند.

آزمون های همتا هردو برای اندازه گیری خصیصه ای واحد در مورد جامعه ای واحد تهیه شده اند ،سؤالات آن ها کاملاً یکسان نبوده اما سطح دشواری سؤالات در هر دو فرم یکسان است.

هنگامی که واریانس نمره های دو نیمه آزمون یکسان نباشد میتوان از فرمول ضریب آلفای کرانباخ برای محاسبه ضریب اعتبار استفاده کرد

در روش باز آزمایی خطای ناشی از منابع  خطای درونی محاسبه نمی شود. ضریب همبستگی است که از این روش بدست می آید ضریب ثبات یا پایایی نامیده می شود.

در روش دو نیمه کردن آزمون اگر تعداد سؤال های آزمون زیاد باشد می توان همبستگی سؤالات نیمه اول را با نیمه دوم حساب کرد. در این روش اگر سطح دشواری سؤالات در سراسر آزمون تقریباً یکسان بوده و همچنین اگر آزمون از نوع آمون سرعت نباشد می توان همبستگی سؤالات نیمه اول را با نیمه دوم حساب کرد.

استفاده از روش کودرریچاردسون 20 با صرف وقت کمتری همراه است.

در فرمول کودرریچاردسون 20  اگر همبستگی بین سؤالات زیاد باشد بین سؤالات کوواریانس وجود دارد.

همچنین در این فرمول ضریب همبستگی مشاهده شده با تعداد سؤالات آزمون (K) رابطه مستقیم داشته و برای این که ضریب اعتبار آزمون مثبت و معنی دار باشد باید S2به قدر کافی از Σpq بزرگ تر باشد. 

فقط زمانی که سؤالات آزمون پاسخ های صحیح یا غلط دارند می توان از فرمول کودر ریچاردسون 21 استفاده کرد.

تفاوت نمره های مشاهده شده دو نفر در یک آزمون زمانی معنی دار است که تفاوت نمره های مشاهده شده آن ها حداقل دو برابر خطای معیار اندازه گیری آزمون باشد..

اگر فاصله بین دو آزمون خیلی کم باشد اثر انتقال و اثر تمرین و اگر فاصله بین دو آزمون خیلی زیاد باشد عوامل یادگیری و رشد بر اعتبار آزمون تأثیر می گذارند.

تمرین ششم:

 اگر ضریب همبستگی دو نیمه آزمونی 70/0 باشد ضریب اعتبار آن چقدر است؟

الف- 2/8                          ب- 5/8                         ج- 82/0                               د- 85/0  

 با تشکر شریفی

 

|+| نوشته شده توسط پروانه شریفی در شنبه ۱۲ آذر۱۳۹۰  |
 اعتبار وپایایی آزمون /خطای معیار اندازه گیری

خطای معیار اندازه گیری

شاخصی که متوسط اندازه خطا را در اندازه گیری با یک آزمون نشان می دهد.

 SE=S√(1-r11)

  SE = خطای معیار اندازه گیری آزمون

 S= انحراف معیار نمره های خام آزمودنی های گروه نمونه

نکته۱ : بین خطای معیار اندازه گیری وضریب اعتبار آزمون رابطه معکوس

وجود  دارد و هرچه ضریب اعتبار به یک نزدیکتر باشد اندازه خطای معیار

اندازه گیری کمتر می شود وبالعکس.

نکته ۲ : با توجه به  تحلیل فرمول خطای معیار اندازه گیری می توان چنین

نتیجه گرفت که تفاوت نمره های مشاهده شده دو نفر در یک آزمون زمانی

 معنی دار است که تفاوت  نمره های مشاهده شده آن ها حداقل دو برابر

 خطای معیار اندازه گیری  آزمون باشد.

ضریب اعتبار چه اندازه باید باشد؟

میزان  قابل قبول ضریب اعتبار یک آزمون به هدف اندازه گیری بستگی دارد.

مثلاً ضریب اعتبار هدف های پژوهشی  بین ۷۰/۰ تا ۸۰/۰کافی به نظر

می رسد.

 اما ضریب اعتبار مطالعات بالینی وآزمونی که برای تصمیم گیری های

 مهم در آینده افراد به کار می رود باید بیش از ۹۵/۰ باشد.

روش های افزایش اعتبار آزمون

۱- افزایش تعداد سؤالات :

با به کار بستن الگوی نمونه گیری حیطه با افزایش تعداد سؤالات آزمون اعتبار

آزمون نیز افزایش می یابد. زیرا هر اندازه تعداد سؤالات  بیشتر باشد احتمال

 آنکه آزمون معرف واقعی خصیصه مورد اندازه گیری باشد بیشتر است.

۲- حذف سؤالات ناهمساز:

سؤال یا سؤالاتی که همبستگی کمی با کل آزمون دارند (خیلی آسان یا

خیلی دشوار ) باید از آزمون حذف شوند.حذف این گونه سؤالات موجب

افزایش عتبار آزمون می شود.

۳- اصلاح برای کاهش ضریب اعتبار :

ضریب اعتبار پایین در پژوهش های روانی مسئله مهمی است ،زیرا احتمال

 یافتن همبستگی های معنی دار بین متغیر هارا کاهش می دهد.

اما نظریه های اندازه گیری این امکان را می دهد که همبستگی بالقوه بین 

دو اندازه را در صورتی که بر اثرخطای اندازه گیری کاهش نیافته باشند برآورد کنیم.

با این روش می توان کاهش همبستگی بر اثر خطای اندازه گیری را اصلاح کرد.

تمرین چهارم :

انحراف معیار و ضریب اعتبار یک آزمون هوش به ترتیب برابر  ۱۴و ۸۴/۰ است.

اگر نمره مشاهده شده یک آزمودنی در این آزمون برابر ۱۰۹ باشد حدود

 نمره واقعی او را در سطح اطمینان ۹۵درصد برآورد کنید.

تمرین پنجم:

تفاوت نمره های مشاهده شده دو نفر در یک آزمون چه زمان معنی دار است ؟

لطفاْ جواب را به روش قبل ( از طریق لینک نظر بدهید) ارسال نمایید.

با تشکر شریفی

|+| نوشته شده توسط پروانه شریفی در چهارشنبه ۹ آذر۱۳۹۰  |
 
 
بالا