روانشناسی و علوم تربیتی

نظریه تعمیم پذیری(GT)

 

عوامل مختلفی، نمرات مشاهده شده آزمون را تحت تأثیر قرار می­دهد. در نظریه کلاسیک آزمون، همه

این عوامل تحت یک عبارت خطای تصادفی نامتمایز در مدل آماری گنجانیده می­شود. روان­سنجان برای لحاظ کردن این عوامل و تفکیک آنها در مدل­های آماریشان، نظریه تعمیم­پذیری را گسترش دادند. بنا به گفته­ی برنان (a2010)، نظریه تعمیم­پذیری چارچوب مفهومی گسترده و مجموعه محکمی از روش­های آماری را برای پرداختن به مسائل اندازه گیری متعدد فراهم کرده است تا حدی که، این نظریه را می­توان به دلیل به کار بستن روش­های تحلیل واریانس(ANOVA) به عنوان بسطی از نظریه کلاسیک آزمون تلقی کرد. نظریه کلاسیک آزمون و ANOVA را می­توان به عنوان والدین نظریه تعمیم­پذیری پنداشت، اما این کودک هم بیشتر و هم کمتر از پیوند ساده­ی والدینش است. اگر چه نظریه تعمیم­پذیری، نظریه کلاسیک آزمون را گسترش داده است، اما همه ابعاد نظریه کلاسیک آزمون در نظریه تعمیم­پذیری وارد نشده است. علاوه بر این، مسائل ANOVA که در نظریه تعمیم­پذیری بر آن تأکید می­شود متفاوت از مسائلی است که در بسیاری از طرح­های آزمایشی و متون ANOVA غالب است. نظریه تعمیم­پذیری به طور خاص بر روی مؤلفه­های واریانس و برآوردشان تمرکز می­ کند.
در این نظریه با تجزیه واریانس نمره کل به رویه های چندگانه، امکان برآورد درصد واریانس ناشی از هر رویه بوجود می­آید و از این طریق می­توان رویه­ای (منبع خطا) که مقدار مؤلفه واریانس آن و یا مقدار مؤلفه­های واریانس اثرهای متقابل آن زیاد است را شناسایی کرد و در ادامه با اقدامات مؤثر مقدار واریانس خطا را کاهش داد و فرایند اندازه ­گیری را بهبود بخشید. فرض کنید در بررسی که انجام داده­اید، رویه ارزیاب مؤلفه واریانس بزرگتری دارد. در اینجا می­توان با افزایش سطوح این رویه (افزایش تعداد ارزیابان) و یا آموزش بهتر برای ارزیابان، به ثبات بهتری در بین ارزیابان رسید. همان­طور که فن و سان (۲۰۱۳) بیان نموده اند؛ این نظریه با مطالعات D برای طرح­های اندازه ­گیری مختلف، به محققین  این امکان را می­دهد که تأثیر سطوح اندازه ­گیری را بر روی اندازه اعتبار بسنجند و اندازه اعتبار را در مطالعه واقعی­شان پیش ­بینی کنند. در این راستا محققین می­توانند با بهره گرفتن از قابلیت انعطاف پذیری و پیش ­بینی این نظریه و با در نظر گرفتن ملاحظات عملی، پروتکل اندازه گیری بهینه­ای را طراحی کنند.

در GT، اعتبار مسئله­ای است از نظر درجه­ای که می­توان از یک مشاهده به جهانی از مشاهدات تعمیم

داد (کرونباخ، گلیسر، ناندا و راجاراتنام، ۱۹۷۲، به نقل از براون، ۲۰۰۵). از آنجا که یک اندازه خاص ممکن است به جهان­های بسیار متفاوتی تعمیم داده شود، بنابراین با ضرایب اعتبار مختلفی همراه خواهد بود. ضریب  تعمیم­پذیری (اعتبار) یک آزمون، ویژگی تغییر­­ناپذیر آن نیست بلکه تحت تأثیر شرایط اجرای آزمون قرار دارد. بر اساس این نظریه، یک آزمون می ­تواند برای برخی مقاصد معتبر باشد ولی برای مقاصد دیگر کاملاً نامعتبر باشد. ­GT قابلیت کاربرد گسترده­ای دارد و در زمینه ­های متعددی به کار گرفته شده است.

مفاهیم و اصطلاحات در GT

بنا به گفته­ی برنان (a2010) مهمترین وجه و ویژگی منحصر به فرد GT چارچوب مفهومی آن است.

لذا برای ارتباط برقرار کردن با این نظریه و درک چارچوب مفهومی آن، مفاهیم و اصطلاحات رایج در این نظریه جداگانه و با بهره گرفتن از مثال زیر شرح داده می­شود.

مثال : از دانش­آموزانی که در المپیاد زیست­شناسی شرکت کرده بودند، خواسته شد به چند سوال تشریحی پاسخ دهند. هر یک از سوالات توسط دو ارزیاب، نمره گذاری می­شود.

هدف اندازه ­گیری   

هدف اندازه ­گیری عاملی است که عمدتاً روی آن متمرکز شده و می ­تواند هر چیزی باشد که مورد توجه اندازه ­گیری در یک وضعیت خاص قرار می­گیرد. در بسیاری از وضعیت­های اندازه ­گیری، افراد هدف اندازه ­گیری هستند. هدف اندازه ­گیری در مثال ذکر شده، دانش­ آموزان هستند.

جامعه

جامعه به اهداف اندازه ­گیری اختصاص دارد.

رویه­ ها        

مجموعه ­ای از سطوح اندازه ­گیری که قصد آن است عملکرد آزمودنی­ها در این سطوح مورد سنجش قرار گیرد؛ ابعاد روش اندازه ­گیری؛ منابع بالقوه­ای از خطا در تعمیم.

مثال ذکر شده، دارای دو رویه است. رویه­ سوال و رویه ارزیاب. هر یک از سوالات یک سطح     اندازه ­گیری قابل قبول برای رویه سوال را می­سازد. بدین ترتیب نمره­ی مشاهده شده­ی سوالات آزمون فرد، یک نمونه تصادفی از تمام سوالات ممکن یا جهان سوالات قابل قبول فرض می­شود. همچنین هر فرد ارزیاب یک سطح اندازه ­گیری قابل قبول برای رویه ارزیاب است. نمره­ی داده شده توسط این ارزیابان، یک نمونه تصادفی از تمام نمراتی است که توسط جهان ارزیابان قابل قبول به دست می­آید.

جهان  

جهان نوعاً برحسب مجموعه ­ای از سطوح اندازه ­گیری تعریف می­شود که نسبت به سطوحی که از طریق اندازه ­گیری­های نمونه به دست می­آید وسیع­تر است.

جهان مشاهدات قابل قبول

جهان مشاهدات قابل قبول بوسیله همه ترکیبات ممکن از سطوح رویه ها تعریف می­­شود. یک اندازه  رفتاری (مثل نمره آزمون) به عنوان نمونه­ای از یک جهان مشاهدات قابل قبول تصور می­شود که این جهان، شامل همه مشاهدات ممکن است که تصمیم­گیرندگان جایگزین­های قابل قبولی از آن برای مشاهده موجود (تحت مطالعه) در نظر می­گیرند (وب و شیولسون، ۲۰۰۵). جهان مشاهدات قابل قبول در مثال مذکور، شامل دو رویه سوال و ارزیاب است.

جهان تعمیم

برنان (۲۰۰۱) بیان می­ کند جهان تعمیم، جهانی است که محقق قصد دارد نتایج یک روش اندازه ­گیری خاص را به آن تعمیم دهد. مجموعه کاملی از مشاهدات ممکن که قصد آن است به آن تعمیم داده شود. جهان تعمیم ممکن است شامل تعدادی یا همه­ی رویه­ ها و سطوح شان در جهان مشاهدات قابل قبول باشد.

نمره جهان

نمره جهان، میانگین اندازه ­گیری­ها در جهانی که به آن تعمیم داده می­شود. طبق بیان برنان (a2010)، در اصل برای هر فرد، برای هر تکرار از روش اندازه ­گیری در جهان تعمیم می­توان نمره­ی میانگینی تصور کرد. برای چنین فردی، ارزش مورد انتظار از این نمرات میانگین به عنوان نمره جهان فرد تعریف می­شود و واریانس نمرات جهان همه افراد در جامعه، واریانس نمره جهان نامیده می­شود. این شباهت مفهومی با واریانس نمره واقعی در نظریه کلاسیک آزمون دارد. در هر اندازه ­گیری سعی می شود شرایطی مهیا شود که واریانس نمره جهان زیاد و میزان سایر مؤلفه­های واریانس (واریانس­های خطا) کم باشد.
فایل متن کامل این پایان نامه در سایت abisho.ir موجود است.
رویه تصادفی

این مطلب را هم بخوانید :
مشاوره و راهنمایی در ایران

نظریه تعمیم­پذیری اساساً نظریه­ اثرات تصادفی است. یک رویه تصادفی از طریق نمونه گیری سطوح یک رویه به طور تصادفی ایجاد می­شود. حتی اگر سطوح یک رویه به طور تصادفی نمونه گیری نشده باشند، رویه ممکن است تصادفی در نظر گرفته شود اگر سطوح مشاهده نشده در مطالعه G قابل جا به ­جایی با سطوح مشاهده شده باشد (وب، شیولسون و هرتل، ۲۰۰۷). در مثال مذکور اگر رویه ارزیاب، تصادفی در نظر گرفته شود در این صورت، ارزیابانی که به کار گرفته می­شوند، یک نمونه تصادفی از تمام ارزیابان مشابه ممکن محسوب می­شوند.

رویه ثابت

رویه­های ثابت تنها شامل سطوحی هستند که محقق به استفاده از آن ها تمایل دارد. وب و همکاران (۲۰۰۷) بیان می­ کنند که رویه ثابت زمانی رخ می­دهد که ؛

  • تصمیم گیرنده با قصد قبلی سطوح خاصی را انتخاب کند و تمایل به تعمیم­دهی فراتر از آن­ها نداشته باشد.
  • تعمیم دادن به ورای سطوح مشاهده شده غیرمنطقی باشد.
  • هنگامی که کل جهان سطوح، کوچک باشد و طرح اندازه ­گیری همه سطوح را در برگیرد.

در مثال مذکور اگر رویه ارزیاب ثابت باشد در این صورت ارزیابان فعلی که به کار رفته اند همه ارزیابان ممکن برای سنجش هستند و نمونه ای از جهان بزرگتر ارزیابان نیستند.

طرح­های متقاطع

طرح­های متقاطع، طرح­هایی هستند که هر سطح از هر رویه برای هر سطح از رویه­های دیگر تکرار    می­شود. در مثال مذکور، اگر هر ارزیاب (r)، هر سوال (i) را نمره گذاری کند در این صورت، ارتباط بین r و i متقاطع بوده و به صورت i × r نشان داده می شود. علامت  ×” متقاطع با” خوانده می­شود.

طرح­های آشیانه­ای

زمانی یک رویه را درون رویه دوم آشیانه­ای می­گویند؛ اگر مجموعه­های متفاوتی از سطوح اندازه ­گیری

اولین رویه، در ترکیب با همه سطوح اندازه ­گیری دومین رویه رخ دهد. در مثال بیان شده، اگر هر سوال (i) توسط گروه متفاوتی از ارزیابان (r) نمره گذاری شود، در این حالت گفته می­شود؛ ارزیابان در درون سوالات آشیانه کرده­اند و به صورت  i  : r نمایش داده می­شود. علامت : ” آشیانه کرده درون ” خوانده    می­شود.

انواع مطالعات  

مطالعه­ تعمیم­پذیری (مطالعه G)

پژوهشگری که به مطالعه G می ­پردازد عمدتاً علاقه­مند است بداند تا چه اندازه نمونه­ای از اندازه ­گیری­ها به جهان اندازه ­گیری­ها قابل تعمیم است. هدف این مطالعه این است که کمک کند تا مطالعه­ای طرح شود که تعمیم­پذیری مناسب داشته باشد (کروکر و آلجینا،۲۰۰۸ ، ترجمه ی فرزاد و زارع، ۱۳۸۸، ص۱۲). یک مطالعه G جهت برآورد و تفسیر مؤلفه­های واریانس مربوط به رویه­های (منابع خطا) اندازه ­گیری که محقق قصد بررسی آنها را دارد و با در نظر گرفتن ملاحظات عملی و منطقی طراحی می­شود.

مطالعه­ تصمیم (مطالعه D)

یک مطالعه D از مؤلفه­های واریانس برآورد شده مطالعه G به منظور برآورد اثرات سطوح مختلف طرح

بر اتکاپذیری اندازه­ها استفاده می­ کند تا بدین وسیله بهترین روش اندازه ­گیری (کمینه­سازی منبع خطا – بیشینه­سازی اتکاپذیری) را طراحی کند. از مطالعات D به منظور گرفتن تصمیم­های اساسی درباره اهداف اندازه ­گیری استفاده می­شود. همچنین در طراحی چنین مطالعه­ای، جهان تعمیم باید تعریف شود(وب و شیولسون،۱۹۸۱؛ برنان،۲۰۰۱).

ملاحظات مطالعات G و D

در مطالعات G می­بایست تا جایی که امکان­پذیر است از طرح­های متقاطع استفاده کرد و از طرح­های آشیانه­ای اجتناب نمود. اگر رویه­های ثابت به کار روند و سطوح این رویه­ ها قابل تعویض نباشد، باید برای هر سطح، مطالعات G جداگانه­ای انجام داد. حجم نمونه در مطالعه D نیازی نیست همانی باشد که در مطالعه G به کار رفته است. همچنین در مطالعه D ممکن است برای سهولت یا برای افزایش تعمیم پذیری برآورد شده، طرح­های آشیانه ای به کار گرفته شود. در این مطالعه تصمیم­ها معمولاً مبتنی بر میانگین همه­ی مشاهدات چندگانه (مثل سوالات آزمون) است در حالیکه مطالعه  Gبر روی مشاهدات منفرد (مثل یک تک سوالی) تمرکز می­ کند.

انتخاب تعداد سطوح هر رویه در مطالعه D، و همچنین انتخاب طرح (آشیانه­ای در مقابل متقاطع، رویه ثابت در مقابل تصادفی)، ملاحظات منطقی و عملی و همچنین مسائل اتکاپذیری را در بر می­گیرد (وب و شیولسون، ۲۰۰۵). در پاسخ به سوال ” چه هنگام مطالعات G و مطالعات D به کار می­روند؟” براون ( ۲۰۰۵) بیان می­ کند که ابتدا مطالعهG  باید انجام شود؛ سپس و تنها بعد از آن، یک مطالعه D کاربردی را دنبال کرد. انجام هر یک بدون دیگری کمتر معقول است و این دو مطالعه را باید با هم و به طور متوالی به کار بست.

برای درک بهتر و کلی­تر­ی از این نظریه، دو طرحp×i×r  وP×I×R در بافت مثال مذکور و در قالب عناوین  ” جهان مشاهدات قابل قبول و مطالعات G” و “جهان تعمیم و مطالعات D” تشریح می­شوند. در این زمینه از مقاله برنان (a2010) استفاده شده است.

جهان مشاهدات قابل قبول و مطالعات G

      فرض کنید که  سوال، نمونه­ای از یک جهان به طور نامحدود بزرگ از سوالات بالقوه و  ارزیاب، نمونه­ای از جهان به طور نامحدود بزرگ از ارزیابان بالقوه است. سوالات و ارزیابان، رویه­های موجود در جهان مشاهدات قابل قبول هستند. همچنین، فرض می­شود که در اصل هر یک از سوالات در جهان مشاهدات قابل قبول می­توانند توسط هر یک از ارزیابان در جهان ارزیابی شوند. در این صورت    گفته می­شود که دو رویه در جهان مشاهدات قابل قبول، متقاطع (i×r) هستند. درGT کلمه جهان به سطوح اندازه ­گیری (در مثال مذکور، سوالات و ارزیابان) اختصاص داده شده است و کلمه جامعه برای اهداف اندازه ­گیری (دانش­ آموزان) به کار می رود. اگر هر شخص در جامعه بتواند به هر سوال در جهان پاسخ دهد که توسط هر ارزیاب در جهان ارزشیابی می­شود، گفته می­شود که جامعه و جهان مشاهدات قابل قبول متقاطع هستند که به صورت p×i×r نشان داده می­شود. برای این وضعیت، هر نمره قابل مشاهده برای سوال واحدی که توسط ارزیاب واحدی ارزیابی می­شود را می توان به صورت زیر نشان داد:

این مطلب را هم بخوانید :
نهضت بهداشت  روانی.

واریانس این نمره کل مشاهده شده درکل جامعه ی افراد و سطوح در جهان مشاهدات قابل قبول، به هفت قسمت مستقل تجزیه می­شود که مؤلفه­های واریانس نامیده می­شوند.

هنگامی که فرض می­شود جامعه و دو رویه در جهان مشاهدات قابل قبول به طور نامحدودی بزرگ هستند، مؤلفه­های واریانس؛ مؤلفه­های واریانس اثرات تصادفی نامیده می­شوند. این نکته حائز اهمیت است که این مؤلفه­های واریانس برای نمرات واحد فرد – سوال – ارزیاب است، بعد از اینکه جامعه و جهان مشاهدات قابل قبول مشخص شد، نوبت جمع­آوری و تحلیل داده­ ها برای برآورد مؤلفه­های واریانس است. نوع خاصی از تحلیل داده ­های واقعی، مطالعه­ G را تشکیل می­دهد. هدف از این مطالعه، برآورد مؤلفه­های واریانس برای جامعه و جهان مشاهدات قابل قبول است. این معمولاً با بهره گرفتن از میانگین مجذورات انجام می­گیرد. می­توان واریانس­های واقعی (پارامتر­ها) را برآورد کرد. برای مثال، برآوردی از مؤلفه واریانس است و به شیوه ی زیر تفسیر می­شود؛ فرض می­شود برای هر فرد در جامعه، نمره میانگین فرد ( به طور فنی نمره مورد انتظار) در تمام سوالات و همه ارزیابان در جهان مشاهدات قابل قبول به دست آمده که همان نمره جهان است. واریانس این نمرات میانگین (در سراسر جامعه ی افراد) است. بدین ترتیب می­توان دیگر اثرات اصلی و اثرات تعاملی واریانس موجود را تفسیر کرده و تعیین کرد کدام مؤلفه (ها) واریانس، بیشترین تغییرپذیری را در نمرات فرد ایجاد می­ کند.

جهان تعمیم و مطالعات D

مؤلفه­های واریانس برآورد شده مطالعه G را می توان به منظور طراحی روش­های اندازه گیری کارآمد

برای استفاده عملیاتی و فراهم کردن اطلاعاتی برای گرفتن تصمیم­های اساسی در مورد اهداف اندازه ­گیری (یعنی دانش­ آموزان در این مثال)، در مطالعات مختلف D به کار برد. مطالعات D بر برآورد، استفاده و تفسیر مؤلفه­های واریانس برای گرفتن تصمیم با روش های اندازه ­گیری تعیین شده تأکید می­ کند. مهمترین مسئله مطالعه D، تعیین جهان تعمیم است که آن جهانی است که تصمیم­گیرنده می­خواهد بر اساس نتایج یک روش اندازه ­گیری خاص به آن تعمیم دهد. جهان تعمیم به دو صورت محدود و نامحدود می باشد. در مثال مذکور، جهان تعمیم فرض شده است که شامل همه سوالات و ارزیابان در جهان مشاهدات قابل قبول است. از آنجا که هر دو رویه نامحدود فرض شده ­اند، جهان تعمیم نیز نامحدود تلقی می­شود. این اشاره دارد به اینکه محقق می­خواهد نمرات مشاهده شده فرد را که بر پایه سوالات و ارزیابان خاص در روش اندازه ­گیری قرار دارد به نمراتشان برای یک جهان تعمیم که شامل همه­ی تعداد نامحدود سوالات و ارزیابان است، تعمیم دهد. جهان تعمیم تقریباً با تکرار­های بالقوه از روش اندازه ­گیری مرتبط است. فرض می­شود که در آن روش اندازه ­گیری، هر شخص به  سوال پاسخ می­دهد و هر پاسخ به هر سوال توسط همان  ارزیاب ، ارزیابی می­شود. بعلاوه فرض می­شود که تصمیم­ها در مورد یک شخص بر­اساس نمره میانگین­اش در سراسر    مشاهده مرتبط با فرد است. این توصیف کلامی از یک مطالعه D، طرح است( برای مطالعه  از حروف بزرگ استفاده می­شود). طرح نامبرده شبیه طرح   مطالعه  است اما دو تفاوت مهم بین این دو طرح وجود دارد: اول اینکه حجم نمونه برای مطالعه D­­­ ( و ) مستلزم این نیست که همان حجم نمونه­ای باشد که برای مطالعه G ( ) به کار رفته است. دوم، مطالعه  بر روی میانگین نمره­ ها برای افراد تمرکز می­ کند به جای نمرات واحد فرد – سوال – ارزیاب که تمرکز مؤلفه­های واریانس برآورد شده­ی مطالعه است.
تکرار روش اندازه ­گیری نمونه متفاوتی از  سوال و نمونه متفاوتی از ارزیاب را در بر­می­گیرد. چنین روش­های اندازه ­گیری به عنوان تصادفی موازی توصیف می­شوند. این تکرار و تجدید­های تصادفی موازی تمام جهان تعمیم را شامل می­شود، به این معنی که تکرارها همه سطوح در جهان را مورد استفاده قرار می­دهد. برای طرح P×I×R مطالعه D، مدل خطی برای یک نمره میانگین مشاهده­پذیر در تمام  سوال و  ارزیاب را می­توان به صورت زیر نمایش داد:

واریانس­های اثرات نمره در معادله بالا، مؤلفه­های واریانس مطالعه D نامیده می­شود. هنگامی که فرض شده است جامعه و همه رویه­ ها در جهان تعمیم نامحدود هستند، این مؤلفه­های واریانس، مؤلفه­های واریانس اثرات تصادفی هستند که آن­ها را می توان از طریق تقسیم مؤلفه­های واریانس برآورد شده مطالعه G بر حجم نمونه به دست آورد (اثر هدف اندازه ­گیری از قاعده تقسیم مستثنی است).

مدل­های تصادفی و ترکیبی با جهان­های تعمیم نامحدود و محدود

برای معنی­داری تحلیل­ها، در هر تحلیل تعمیم­پذیری باید حداقل یک رویه تصادفی باشد. در مدل­های تصادفی، همه­ی رویه­ ها تصادفی هستند و این مدل­ها با جهان­های تعمیم نامحدود مرتبط­اند. در مقابل در مدل ترکیبی، ترکیبی از رویه­های ثابت و تصادفی وجود دارد. تثبیت یک رویه، جهان تعمیم محدود را به دنبال خواهد داشت. بنابراین جهان تعمیم برای رویه ثابت محدودتر از جهان تعمیم برای رویه تصادفی است. جهان تعمیم محدود از آنجا که نسبت به جهان نامحدود کمتر مستعد خطاست لذا واریانس نمره جهان و به تبع ضریب تعمیم­پذیری بزرگتری دارد. همان طور که برنان (a2010) متذکر می­شود، نمی­توان گفت که جهان محدود رجحان دارد، زیرا محدود کردن یک جهان همچنین گسترده­ای که یک محقق      می ­تواند به آن تعمیم دهد را محدود می­ کند.

[۱]. analysis of variance (ANOVA)

[۲]. variance components

[۳]. facets

[۴]. Fan & Sun

[۵]. measurement conditions

[۶]. Brown

[۷]. population

[۸]. universe

[۹]. universe of admissible observations

[۱۰] .universe of generalization

[۱۱] .universe score

 

[۱۲]. random facet

[۱۳]. Webb

[۱۴]. Shavelson

[۱۵]. Haerte

[۱۶]. fixed  facet

[۱۷]. crossed designs

[۱۸]. nested  designs

[۱۹]. generalizability study

[۲۰]. decision study

  1. universe of generalization

[۲۲]. universe of admissible observatios and G studie

[۲۳]. universe of generalization and D Studies

[۲۴]. random effects variance components

[۲۵]. mean squares

[۲۶]. interaction effects

[۲۷]. restricted

[۲۸]. infinite

[۲۹] .randomly parallel

[۳۰]. random models

  1. mixed

You may also like...

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *