بناء الاختبارات وفق النظرية الحديثة
نظرية الاستجابة للمفردة
الاختبارات النفسية والتربوية بعامةتفترض أن هناك سمات أو خصائص معينة
يشترك فيها جميع الأفراد ولكنهم يختلفون فيمقدارها ، وبالرغم من أن هذه
السمات غير منظورة ولا يمكن قياسها بطريقة مباشرةإلا أنه يمكن الاستدلال
على مقدارها من السلوك الملاحظ للفرد المتمثل فياستجاباته على مفردات
الاختبار ، وهذا ما يبرر تسميتها بالسمات الكامنة ، فالسمةالتي تكمن وراء
استجابة الفرد على مفردات اختبار لفظي ، تختلف عن السمة التيتكمن وراء
استجابته على مفردات اختبار مكاني أو عددي. ولكن يمكن أن تكمن سمةواحدة
وراء استجابته على مفردات اختبارين مختلفين متعلقين بنفس المحتوى .
لذلك فإن الهدف الأساسي لكل من للنظرية الكلاسيكية ونظريةالسمات
الكامنة هو تحديد العلاقة بين استجابات الأفراد على اختبار معينوالسمة
الكامنة وراء هذه الاستجابات ، والأمر الأكثر أهمية في القياسالنفسي
والتربوي بعامة هو تحديد مقدار السمات الكامنة وراء أداء الأفرادعلى
الاختبارات المختلفة والاستفادة منها في تفسير النتائج والتنبؤ بسلوكهمفي
مواقف مماثلة ، واتخاذ قرارات معينة بشأنهم في ضوء هذا التقديرالكمي
للسمات. وتتلخص افتراضات نظرية الاستجابة للمفردة في النقاطالتالية:
(1) إن أداء الفرد في اختبار معينيعتمد على قدرة يمتلكها أو سمة معينة
يمكن قياسها في بعد واحد. ففي اختبارالإملاء يمكن أن نتحدث عن القدرة
الإملائية وفي اختبار الحساب نتحدث عن القدرةالحسابية... وهكذا، كما أن
بنود الاختبار لابد أن تكون متجانسة لقياس هذه القدرةأو السمة الكامنة.
وعلية فإن الاختبار الذي تتعد أبعاده لا يمكن أن يكون مناسبالنماذج
السمات الكامنة. فالاختبار المناسب لاستخدام نماذج السمات الكامنة فيذلك
الاختبار أحادي البعد.
(2) يفترض في البنود أنها تحقق خاصيةالاستقلال المركزي أي أن الإجابة على بند من النبو لا تؤثر أو تتأثر بالإجابة علىبند آخر.
(3) إن العلاقة بين أداء الفرد في كل بند من بنود الاختباروبين القدر
التي يقيسها الاختبار يمكن وصفها بدالة رياضية تصاعدية تسمى دالةسنة
البند ICC (منحنى سمة البند) . وهذه الدالة توفر احتمالاتالاستجابة
الصحيحة للبند في مستويات مختلفة من القدرة، فأصحاب القدرات العاليةيحتمل
توصلهم إلى الإجابة الصحيحة على السؤال بشكل يفوق أصحاب القدرةالمنخفضة.
مثال بالرسم على منحنيات البنود:
يلاحظ منالرسم السابق أن البند الأول يتقاطع مع الاحتمالية (50) عند
مستوى القدرة (صفر) وهذا يعني أن معامل الصعوبة لهذا المنحنى = 0.0
ولو نظرنا مثلا إلى مستوىالقدرة( -2 ) نجد أن احتمالية الإجابة الصحيح لأصحابها هذه القدرة تساويصفر
فنحن هنا نتحدث عن بند واحد في الاختبار ونتحدث عن احتمال التوصلإلى
الإجابة الصحيحة على البند. وهذا ما يميز النظرية الحديثة أنها لاتنظر
إلى الدرجة النهائية للاختبار وإنما تنظر إلى استجابة الفرد لكل بند.. كما
أنها تعتمد على احتمال التوصل إلى الإجابة الصحيحة وهذا الأمر لاتوفره
النظرية التقليدية.
ملامح نظرية الاستجابة للبند:
1- قيم مؤشرات البند (الصعوبة ، التمييز) لا تعتمد على المجموعة أو العينة التي أخذتالاختبار.
2- قيم قدرات الأفراد لا تعتمد على مجموعة الأسئلة المختارة فيالاختبار.
3- يمكن تحديد مدى دقة التقديرات التي توقرها النظرية سواء فيمايخص
البند(مؤشرات البند) أو فيما يخص الفرد الذي أخذ الاختبار (قدرات
الأفراد).
ومن هذا يتبين أن احتمال الاستجابة الصحيحة على بند معينمن قبل أفراد تقع
قدراتهم في مستوى معين ، يعتمد على ذلك المستوى وليس على عددالأفراد في
ذلك المستوى ، و بذلك فإن مؤشرات البند (الصعوبة والتمييز) ثابتة حتىلو
تغيرت المجموعة التي أخذت الاختبار أو زاد عددها.
نماذج نظرية السماتالكامنة
نظراً لاعتماد نظرية السمات الكامنةعلى فرضية أساسية مؤداها أن القيمة
الاحتمالية لاستجابة فرد لمفردة اختباريةتكون دالة لكل القدرة التي يفترض
أن الاختبار يقيسها لدى الفرد ، وخصائص المفردةالتي يحاول الإجابة عنها ،
فإن ذلك يتطلب الحصول على معلومات من مصدرين : أحدهمايتعلق بالفرد ،
والآخر يتعلق بالمفردة الاختبارية . وعادة نحتاج إلى :
قيمةعددية واحدة تتعلق بالفرد ، وهى بارامتر القدرة المقاسة لدى الفرد Ability Parameter ،
وقيمة عددية أو أكثر تتعلق بالمفردة الاختبارية بارامتر أوبارامترات المفردة Item Parameters
وفى ضوء عدد بارامترات المفردات ،فإنه يندرج تحت نظرية السمات الكامنة مجموعة من النماذج السيكومترية منأهمها:
1- النماذج ثلاثية البارامتر : ومنأمثلتها نموذج
بيرن بوم ( 3PL Birnbaum Model )، وتفترض هذه النماذج أن المفرداتتختلف
في صعوبتها وتمييزها ، وكذلك في بارامتر التخمين الذي يمثل احتمالتوصل
الأفراد ذوى القدرة المنخفضة إلى الإجابة الصحيحة عن المفردة ، وخاصةفي
المفردات من نوع الاختيار من متعدد.
[ ويرمز لمعامل التمييز (ِa) ومعاملالصعوبة (b) ومعامل التخمين (c) ]
2- النماذج ثنائيةالبارامتر: ومن أمثلتها نموذج
لورد( 2PL Lord Model )، وتفترض هذهالنماذج أن المفردات تختلف في صعوبتها
وتمييزها بين المستويات مختلفةالقدرة.
[ معامل التمييز (ِa) ومعامل الصعوبة (b) ]
3- النموذج أحادى البارامتر: ويطلق عليه نموذج راش(
1PL Rasch Model ) نسبة إلى العالم جورج راش الذي أرسى قواعده. ويفترض هذا
النموذجأن مفردات الاختبار تختلف فقط في صعوبتها وتتساوى في تمييزها.
[ معامل الصعوبة (b) ]
هل هناكتقارب أو نقطة تلاق بين نظريتي القياس؟؟
في النظرية التقليدية كنا نتحدث عنالدرجة الحقيقية ، وفي النظرية الحديثة
تحدثنا عن القدرة، والواقع أن الدرجةالحقيقية والقدرة يرمزان للشيء ذاته
ولكن بمقاييس مختلفة إلا أن الفارق بينهم هوأن الدرجة الحقيقية تعتمد على
الأسئلة التي يتكون منها الاختبار، في حين أنمقياس " القدرة " مستقل عن
أسئلة الاختبار.
أهمالفروق بين نظريتي القياس
أولا : توفر النظرية الحديثة
مفهوماجديدا يختلف عن الثبات يدعى (دالة المعلومة) التي نحصل عليها من
تطبيق بند أواختبار. وهذه المعلومة تعني مقدار الثقة في أننا حصلنا على
معلومات تقودنا إلىتقدير قدرة فرد معين أو مجموعة من الأفراد في مستوى
واحد من القدرة . أي أن كميةالمعلومة نحصل عليها عند كل مستوى قدرة على
طول مقياس القدرة، أو بمعنى آخر أننانحصل على قيم متعددة لكمية المعلومات
التي حصلنا عليها من البند أو الاختبار.. إذا هي تختلف عن الثبات الذي هو
عبارة عن مؤشر واحد فقط للاختبار لكل الأفرادالذين طبق عليهم.
وتمثل دالة المعلومة عادة بمنحنى يبين أعلى وأقل كمية معلوماتحصلنا عليها عند مستويات القدرة المختلفة.
ثانيا : تلعب دالة المعلومة دورامهما
في النظرية الحديثة مثل الدور الذي يلعبه الثبات في النظرية التقليديةإلا
أن الثبات يعتمد على الاختبار والمجموعة التي طبق عليها الاختبارولهذا
يكون تعميمها غير ممكنا.
أما دالة المعلومة فهي تعتمد فقط على مقياسالقدرة وعلى منحنى استجابة
البند ، كذلك فإن الثبات مؤشر للخطأ المعياري فيالقياس وهذا المؤشر ثابت
على جميع مستويات الدرجة الحقيقية . بينما دالةالمعلومة مؤشر للخطأ
المعياري في التقدير وهذا الخطأ يحسب عند كل مستوى منمستويات قدرة الطالب
وتعرف بالتالي دقة تقدير قدرة الفرد على كل مستوى منالمستويات.
ثالثا: الثابتية Invarianceمؤشرات
الاختبار في النظرية التقليدية تتغير بتغيرالمجموعة التي يطبق عليها
الاختبار أما مؤشرات الاختبار في النظرية الحديثة فهيثابتة بصرف النظر عن
المجموعة التي طبق عليها الاختبار كما أن قدرة الشخص ثابتةمهما كانت
الأسئلة التي طبقت عليها .
تطبيقات نظرية السمات
إن نظرية استجابة البند وفرت مجالا خصبا لتحسين تطبيقات قياس نفسية معروفة بالإضافة إلى مجالات تطبيق أخرى:
1- تقنين وتحليل الاختبارات / أصبح من الممكن مقارنة قيم القدرات الفردية
عند التقنين بدلا من الاعتماد على التوزيع التكراري للعينة التي قنن عليها
الاختبار. أي أنه أصبح من الممكن إعداد بنوك من الأسئلة التي حددت
مؤشراتها والاستفادة منها في تقنين الاختبارات.
2- الموازنة أو المساواة بين الاختبارات Equating / يحدث في كثير من
الأحيان مقارنة شخصين أو أكثر بناء على درجاتهم الخام في نماذج مختلفة من
اختبار معين، وهذا فيه شيء من الظلم والإجحاف ، ولهذا فإن النظرية الحديثة
توفر أسلوبا أفضل للمقارنة فهي لا توازن الدرجات الخام وإنما يكون الهدف
هو معرفة موقع القيمة الرقمية لقدرة الفرد على مقياس القدرة.
3- بناء الاختبار / يمكن تحديد نوع الاختبار الذي نريده (اختبار لاختيار
أصحاب الكفايات العالية لممارسة مهمة خطيرة كالطيران مثلا) عند مستوى
القدرة التي تم تحديدها سلفا.
4- الاختبار التكيفية أو المفصلة / وهي اختبارات فردية يعطى فيها الفرد الأسئلة المناسبة لقدراته.
5- الكشف عن التحيز في الاختبار ( test bias ) ، فقد وفرت نظرية استجابة البند نموذجا أفضل للكشف عن تحيز الاختبار
نظرية الاستجابة للمفردة
Item Response Theory (IRT)
مقدمة
سيطرت نظرية القياس التقليدية فترة ليست بالقصيرة. فقد استخدمت أسس هذه
النظرية في مواقف اختبارية متنوعة تتضمن بناء مختلف أنواع الاختبارات
النفسية ، وكذلك تحليل البيانات المستمدة من هذه الاختبارات.
وبالرغم من سيطرة وانتشار تطبيق هذه النظرية وما ارتبط بها من مقاييس
إحصائية خاصة بتحليل مفردات الاختبار، إلا أنه تبين قصور هذه النظرية في
مواجهة كثير من المشكلات السيكومترية المعاصرة.
ومن بين أوجه القصور ما يلي:
1- إن طرق تحليل الاختبارات المبنية على النظرية التقليدية والمفاهيم
السيكومترية المرتبطة بها، مثل معاملات الصعوبة والتمييز، تختلف باختلاف
خصائص العينة المستخدمة في حساب هذه المعاملات . مثلا: لو سحبنا عينة
مكونة من 100 شخص وحسبنا معامل الصعوبة لبند معين وكانت قيمته 0.75 فهل
سنحصل على نفس هذه القيمة لو سحبنا عينة أخرى مكونة من 100 شخص آخرين؟
الجواب: لا نحصل على نفس القيمة لأن العينة مختلفة. إذا فإن معلم الصعوبة
ليس من المعالم المستقرة لأنه مرتبط ارتباطا مباشرا بطبيعة العينة.
كما أن معامل التمييز (وهو ارتباط البند بالدرجة الكلية ) يتأثر بتباين
استجابة العينة، فمدى تباين الاستجابة يعكس مدى تباين العينة، وبذلك فإن
معامل التمييز يرتبط بخصائص العينة، لذلك من الصعب أن نفصل قيمة معامل
التمييز عن طبيعة العينة.
إذا فإن عملية اعتمادنا على معامل الصعوبة ومعامل التمييز لا تعتبر من
الجوانب الجيدة نظرا لأن هذين العاملين مرتبطان إلى حد كبير بطبيعة وخصائص
العينة المستجيبة ، وبذلك من الممكن أن نحصل على معاملات تمييز وصعوبة
مختلفة من عينة لأخرى تبعا لاختلاف العينة.
2- إن أداء الأفراد على الاختبار يختلف باختلاف بنود الاختبار التي تم
سحبها من مجتمع البنود الكبير، فهذه البنود قد تختلف في صعوبتها وهذا
الاختلاف في صعوبة البنود سينعكس في نهاية المطاف على الأداء المختلف
للأفراد من اختبار لآخر . وقد ينتفي وجود الاختلاف في أداء الأفراد إذا
تضمنت الاختبارات نفس البنود أو بنودا مكافئة لها من حيث مستوى الصعوبة.
3- إن النظرية التقليدية تفترض تساوي تباين أخطاء القياس لجميع الأفراد
الذين يطبق عليهم الاختبار. ولكننا نلاحظ في بعض الأحيان أن بعض الأفراد
يكون أداؤهم في الاختبار أكثر اتساقا من غيرهم من الأفراد، وأن هذا
الاتساق يختلف باختلاف مستوى قدرتهم . ولهذا فإننا ربما نتوقع أن الأفراد
من ذوي القدرة المرتفعة يكون أداؤهم في صورة موازية من صور الاختبار أكثر
اتساقا من أداء الأفراد ذوي القدرة المتوسطة . فمن الطبيعي أن يزيد الخطأ
في الاختبار الصعب المطبق على مجموعة من أصحاب القدرات المنخفضة، ويقل
الخطأ إذا طبق على أصحاب القدرات المرتفعة.
4- تتطلب النظرية التقليدية نماذج متكافئة تماما للاختبار الواحد ، وهذا
مطلب صعب في التطبيق العملي مما يقلل من قيمة النتائج المبنية على نظرية
القياس التقليدية.
وقد استثارت تلك المشكلات العلماء المتخصصين في القياس النفسي والتربوي
للبحث عن الدقة والموضوعية في القياس السلوكي حتى يقترب هذا القياس من
القياس في العلوم الطبيعية ، والتي تتميز بعدم تأثر نتائج القياس بالأداة
المستخدمة طالما أنها أداة مناسبة لتقدير الظاهرة ، كما يكون تدرج الأداة
بوحدات قياس متسـاوية لا تعتمد ولا تتأثر بالعناصر التي تقدر عندها
الظاهرة. ويذكر علام (2000) أن الموضوعية يقصد بها أن درجة الفرد في
الاختبار لا يجب أن تعتمد على عينة الأفراد ، ففي الاختبارات النفسية
المقننة تشتق الدرجات الخام من عينة التقنين ثم يوازن أداء الفرد الذي
يطبق عليه الاختبار فيما بعد بمعايير مشتقة من هذه العينة ، فإذا تغيرت
العينة فقدت هذه المعايير دلالتها ، أي يصبح الاختبار محكوماً بالعينة ،
كما أن الفرد يحصل على الدرجة نفسها في أي اختبارين يقيسان نفس السمة ،
إلا أن درجة الفرد تختلف عادة باختلاف الاختبار الذي يطبق عليه ، أي أن
درجته تصبح محكومة بعينة المفردات التي يختبر بها.
والقياس الموضوعي لا يعتمد في نظامه المرجعي على مقارنة نتائج أداء
المتعلم بأداء الجماعة ، أو بأداء الفرد ذاته في وقت لاحق أو في اختبار أو
مقياس آخر ، بل يعتمد على تقدير علاقة احتمالية بين (الأداء الملاحظ للفرد
في المقياس)و(السمات أو القدرات التي تكمن وراء هذا الأداء وتفسره) . وقد
أسفرت الجهود الباحثين عن ما يعرف باسم :
نظرية السمات الكامنة Latent Trait Theory
وأحيانا تسمى نظرية الاستجابة للمفردة
Item Response Theory(IRT)
نظرية الاستجابة للمفردة
الاختبارات النفسية والتربوية بعامةتفترض أن هناك سمات أو خصائص معينة
يشترك فيها جميع الأفراد ولكنهم يختلفون فيمقدارها ، وبالرغم من أن هذه
السمات غير منظورة ولا يمكن قياسها بطريقة مباشرةإلا أنه يمكن الاستدلال
على مقدارها من السلوك الملاحظ للفرد المتمثل فياستجاباته على مفردات
الاختبار ، وهذا ما يبرر تسميتها بالسمات الكامنة ، فالسمةالتي تكمن وراء
استجابة الفرد على مفردات اختبار لفظي ، تختلف عن السمة التيتكمن وراء
استجابته على مفردات اختبار مكاني أو عددي. ولكن يمكن أن تكمن سمةواحدة
وراء استجابته على مفردات اختبارين مختلفين متعلقين بنفس المحتوى .
لذلك فإن الهدف الأساسي لكل من للنظرية الكلاسيكية ونظريةالسمات
الكامنة هو تحديد العلاقة بين استجابات الأفراد على اختبار معينوالسمة
الكامنة وراء هذه الاستجابات ، والأمر الأكثر أهمية في القياسالنفسي
والتربوي بعامة هو تحديد مقدار السمات الكامنة وراء أداء الأفرادعلى
الاختبارات المختلفة والاستفادة منها في تفسير النتائج والتنبؤ بسلوكهمفي
مواقف مماثلة ، واتخاذ قرارات معينة بشأنهم في ضوء هذا التقديرالكمي
للسمات. وتتلخص افتراضات نظرية الاستجابة للمفردة في النقاطالتالية:
(1) إن أداء الفرد في اختبار معينيعتمد على قدرة يمتلكها أو سمة معينة
يمكن قياسها في بعد واحد. ففي اختبارالإملاء يمكن أن نتحدث عن القدرة
الإملائية وفي اختبار الحساب نتحدث عن القدرةالحسابية... وهكذا، كما أن
بنود الاختبار لابد أن تكون متجانسة لقياس هذه القدرةأو السمة الكامنة.
وعلية فإن الاختبار الذي تتعد أبعاده لا يمكن أن يكون مناسبالنماذج
السمات الكامنة. فالاختبار المناسب لاستخدام نماذج السمات الكامنة فيذلك
الاختبار أحادي البعد.
(2) يفترض في البنود أنها تحقق خاصيةالاستقلال المركزي أي أن الإجابة على بند من النبو لا تؤثر أو تتأثر بالإجابة علىبند آخر.
(3) إن العلاقة بين أداء الفرد في كل بند من بنود الاختباروبين القدر
التي يقيسها الاختبار يمكن وصفها بدالة رياضية تصاعدية تسمى دالةسنة
البند ICC (منحنى سمة البند) . وهذه الدالة توفر احتمالاتالاستجابة
الصحيحة للبند في مستويات مختلفة من القدرة، فأصحاب القدرات العاليةيحتمل
توصلهم إلى الإجابة الصحيحة على السؤال بشكل يفوق أصحاب القدرةالمنخفضة.
مثال بالرسم على منحنيات البنود:
يلاحظ منالرسم السابق أن البند الأول يتقاطع مع الاحتمالية (50) عند
مستوى القدرة (صفر) وهذا يعني أن معامل الصعوبة لهذا المنحنى = 0.0
ولو نظرنا مثلا إلى مستوىالقدرة( -2 ) نجد أن احتمالية الإجابة الصحيح لأصحابها هذه القدرة تساويصفر
فنحن هنا نتحدث عن بند واحد في الاختبار ونتحدث عن احتمال التوصلإلى
الإجابة الصحيحة على البند. وهذا ما يميز النظرية الحديثة أنها لاتنظر
إلى الدرجة النهائية للاختبار وإنما تنظر إلى استجابة الفرد لكل بند.. كما
أنها تعتمد على احتمال التوصل إلى الإجابة الصحيحة وهذا الأمر لاتوفره
النظرية التقليدية.
ملامح نظرية الاستجابة للبند:
1- قيم مؤشرات البند (الصعوبة ، التمييز) لا تعتمد على المجموعة أو العينة التي أخذتالاختبار.
2- قيم قدرات الأفراد لا تعتمد على مجموعة الأسئلة المختارة فيالاختبار.
3- يمكن تحديد مدى دقة التقديرات التي توقرها النظرية سواء فيمايخص
البند(مؤشرات البند) أو فيما يخص الفرد الذي أخذ الاختبار (قدرات
الأفراد).
ومن هذا يتبين أن احتمال الاستجابة الصحيحة على بند معينمن قبل أفراد تقع
قدراتهم في مستوى معين ، يعتمد على ذلك المستوى وليس على عددالأفراد في
ذلك المستوى ، و بذلك فإن مؤشرات البند (الصعوبة والتمييز) ثابتة حتىلو
تغيرت المجموعة التي أخذت الاختبار أو زاد عددها.
نماذج نظرية السماتالكامنة
نظراً لاعتماد نظرية السمات الكامنةعلى فرضية أساسية مؤداها أن القيمة
الاحتمالية لاستجابة فرد لمفردة اختباريةتكون دالة لكل القدرة التي يفترض
أن الاختبار يقيسها لدى الفرد ، وخصائص المفردةالتي يحاول الإجابة عنها ،
فإن ذلك يتطلب الحصول على معلومات من مصدرين : أحدهمايتعلق بالفرد ،
والآخر يتعلق بالمفردة الاختبارية . وعادة نحتاج إلى :
قيمةعددية واحدة تتعلق بالفرد ، وهى بارامتر القدرة المقاسة لدى الفرد Ability Parameter ،
وقيمة عددية أو أكثر تتعلق بالمفردة الاختبارية بارامتر أوبارامترات المفردة Item Parameters
وفى ضوء عدد بارامترات المفردات ،فإنه يندرج تحت نظرية السمات الكامنة مجموعة من النماذج السيكومترية منأهمها:
1- النماذج ثلاثية البارامتر : ومنأمثلتها نموذج
بيرن بوم ( 3PL Birnbaum Model )، وتفترض هذه النماذج أن المفرداتتختلف
في صعوبتها وتمييزها ، وكذلك في بارامتر التخمين الذي يمثل احتمالتوصل
الأفراد ذوى القدرة المنخفضة إلى الإجابة الصحيحة عن المفردة ، وخاصةفي
المفردات من نوع الاختيار من متعدد.
[ ويرمز لمعامل التمييز (ِa) ومعاملالصعوبة (b) ومعامل التخمين (c) ]
2- النماذج ثنائيةالبارامتر: ومن أمثلتها نموذج
لورد( 2PL Lord Model )، وتفترض هذهالنماذج أن المفردات تختلف في صعوبتها
وتمييزها بين المستويات مختلفةالقدرة.
[ معامل التمييز (ِa) ومعامل الصعوبة (b) ]
3- النموذج أحادى البارامتر: ويطلق عليه نموذج راش(
1PL Rasch Model ) نسبة إلى العالم جورج راش الذي أرسى قواعده. ويفترض هذا
النموذجأن مفردات الاختبار تختلف فقط في صعوبتها وتتساوى في تمييزها.
[ معامل الصعوبة (b) ]
هل هناكتقارب أو نقطة تلاق بين نظريتي القياس؟؟
في النظرية التقليدية كنا نتحدث عنالدرجة الحقيقية ، وفي النظرية الحديثة
تحدثنا عن القدرة، والواقع أن الدرجةالحقيقية والقدرة يرمزان للشيء ذاته
ولكن بمقاييس مختلفة إلا أن الفارق بينهم هوأن الدرجة الحقيقية تعتمد على
الأسئلة التي يتكون منها الاختبار، في حين أنمقياس " القدرة " مستقل عن
أسئلة الاختبار.
أهمالفروق بين نظريتي القياس
أولا : توفر النظرية الحديثة
مفهوماجديدا يختلف عن الثبات يدعى (دالة المعلومة) التي نحصل عليها من
تطبيق بند أواختبار. وهذه المعلومة تعني مقدار الثقة في أننا حصلنا على
معلومات تقودنا إلىتقدير قدرة فرد معين أو مجموعة من الأفراد في مستوى
واحد من القدرة . أي أن كميةالمعلومة نحصل عليها عند كل مستوى قدرة على
طول مقياس القدرة، أو بمعنى آخر أننانحصل على قيم متعددة لكمية المعلومات
التي حصلنا عليها من البند أو الاختبار.. إذا هي تختلف عن الثبات الذي هو
عبارة عن مؤشر واحد فقط للاختبار لكل الأفرادالذين طبق عليهم.
وتمثل دالة المعلومة عادة بمنحنى يبين أعلى وأقل كمية معلوماتحصلنا عليها عند مستويات القدرة المختلفة.
ثانيا : تلعب دالة المعلومة دورامهما
في النظرية الحديثة مثل الدور الذي يلعبه الثبات في النظرية التقليديةإلا
أن الثبات يعتمد على الاختبار والمجموعة التي طبق عليها الاختبارولهذا
يكون تعميمها غير ممكنا.
أما دالة المعلومة فهي تعتمد فقط على مقياسالقدرة وعلى منحنى استجابة
البند ، كذلك فإن الثبات مؤشر للخطأ المعياري فيالقياس وهذا المؤشر ثابت
على جميع مستويات الدرجة الحقيقية . بينما دالةالمعلومة مؤشر للخطأ
المعياري في التقدير وهذا الخطأ يحسب عند كل مستوى منمستويات قدرة الطالب
وتعرف بالتالي دقة تقدير قدرة الفرد على كل مستوى منالمستويات.
ثالثا: الثابتية Invarianceمؤشرات
الاختبار في النظرية التقليدية تتغير بتغيرالمجموعة التي يطبق عليها
الاختبار أما مؤشرات الاختبار في النظرية الحديثة فهيثابتة بصرف النظر عن
المجموعة التي طبق عليها الاختبار كما أن قدرة الشخص ثابتةمهما كانت
الأسئلة التي طبقت عليها .
تطبيقات نظرية السمات
إن نظرية استجابة البند وفرت مجالا خصبا لتحسين تطبيقات قياس نفسية معروفة بالإضافة إلى مجالات تطبيق أخرى:
1- تقنين وتحليل الاختبارات / أصبح من الممكن مقارنة قيم القدرات الفردية
عند التقنين بدلا من الاعتماد على التوزيع التكراري للعينة التي قنن عليها
الاختبار. أي أنه أصبح من الممكن إعداد بنوك من الأسئلة التي حددت
مؤشراتها والاستفادة منها في تقنين الاختبارات.
2- الموازنة أو المساواة بين الاختبارات Equating / يحدث في كثير من
الأحيان مقارنة شخصين أو أكثر بناء على درجاتهم الخام في نماذج مختلفة من
اختبار معين، وهذا فيه شيء من الظلم والإجحاف ، ولهذا فإن النظرية الحديثة
توفر أسلوبا أفضل للمقارنة فهي لا توازن الدرجات الخام وإنما يكون الهدف
هو معرفة موقع القيمة الرقمية لقدرة الفرد على مقياس القدرة.
3- بناء الاختبار / يمكن تحديد نوع الاختبار الذي نريده (اختبار لاختيار
أصحاب الكفايات العالية لممارسة مهمة خطيرة كالطيران مثلا) عند مستوى
القدرة التي تم تحديدها سلفا.
4- الاختبار التكيفية أو المفصلة / وهي اختبارات فردية يعطى فيها الفرد الأسئلة المناسبة لقدراته.
5- الكشف عن التحيز في الاختبار ( test bias ) ، فقد وفرت نظرية استجابة البند نموذجا أفضل للكشف عن تحيز الاختبار
نظرية الاستجابة للمفردة
Item Response Theory (IRT)
مقدمة
سيطرت نظرية القياس التقليدية فترة ليست بالقصيرة. فقد استخدمت أسس هذه
النظرية في مواقف اختبارية متنوعة تتضمن بناء مختلف أنواع الاختبارات
النفسية ، وكذلك تحليل البيانات المستمدة من هذه الاختبارات.
وبالرغم من سيطرة وانتشار تطبيق هذه النظرية وما ارتبط بها من مقاييس
إحصائية خاصة بتحليل مفردات الاختبار، إلا أنه تبين قصور هذه النظرية في
مواجهة كثير من المشكلات السيكومترية المعاصرة.
ومن بين أوجه القصور ما يلي:
1- إن طرق تحليل الاختبارات المبنية على النظرية التقليدية والمفاهيم
السيكومترية المرتبطة بها، مثل معاملات الصعوبة والتمييز، تختلف باختلاف
خصائص العينة المستخدمة في حساب هذه المعاملات . مثلا: لو سحبنا عينة
مكونة من 100 شخص وحسبنا معامل الصعوبة لبند معين وكانت قيمته 0.75 فهل
سنحصل على نفس هذه القيمة لو سحبنا عينة أخرى مكونة من 100 شخص آخرين؟
الجواب: لا نحصل على نفس القيمة لأن العينة مختلفة. إذا فإن معلم الصعوبة
ليس من المعالم المستقرة لأنه مرتبط ارتباطا مباشرا بطبيعة العينة.
كما أن معامل التمييز (وهو ارتباط البند بالدرجة الكلية ) يتأثر بتباين
استجابة العينة، فمدى تباين الاستجابة يعكس مدى تباين العينة، وبذلك فإن
معامل التمييز يرتبط بخصائص العينة، لذلك من الصعب أن نفصل قيمة معامل
التمييز عن طبيعة العينة.
إذا فإن عملية اعتمادنا على معامل الصعوبة ومعامل التمييز لا تعتبر من
الجوانب الجيدة نظرا لأن هذين العاملين مرتبطان إلى حد كبير بطبيعة وخصائص
العينة المستجيبة ، وبذلك من الممكن أن نحصل على معاملات تمييز وصعوبة
مختلفة من عينة لأخرى تبعا لاختلاف العينة.
2- إن أداء الأفراد على الاختبار يختلف باختلاف بنود الاختبار التي تم
سحبها من مجتمع البنود الكبير، فهذه البنود قد تختلف في صعوبتها وهذا
الاختلاف في صعوبة البنود سينعكس في نهاية المطاف على الأداء المختلف
للأفراد من اختبار لآخر . وقد ينتفي وجود الاختلاف في أداء الأفراد إذا
تضمنت الاختبارات نفس البنود أو بنودا مكافئة لها من حيث مستوى الصعوبة.
3- إن النظرية التقليدية تفترض تساوي تباين أخطاء القياس لجميع الأفراد
الذين يطبق عليهم الاختبار. ولكننا نلاحظ في بعض الأحيان أن بعض الأفراد
يكون أداؤهم في الاختبار أكثر اتساقا من غيرهم من الأفراد، وأن هذا
الاتساق يختلف باختلاف مستوى قدرتهم . ولهذا فإننا ربما نتوقع أن الأفراد
من ذوي القدرة المرتفعة يكون أداؤهم في صورة موازية من صور الاختبار أكثر
اتساقا من أداء الأفراد ذوي القدرة المتوسطة . فمن الطبيعي أن يزيد الخطأ
في الاختبار الصعب المطبق على مجموعة من أصحاب القدرات المنخفضة، ويقل
الخطأ إذا طبق على أصحاب القدرات المرتفعة.
4- تتطلب النظرية التقليدية نماذج متكافئة تماما للاختبار الواحد ، وهذا
مطلب صعب في التطبيق العملي مما يقلل من قيمة النتائج المبنية على نظرية
القياس التقليدية.
وقد استثارت تلك المشكلات العلماء المتخصصين في القياس النفسي والتربوي
للبحث عن الدقة والموضوعية في القياس السلوكي حتى يقترب هذا القياس من
القياس في العلوم الطبيعية ، والتي تتميز بعدم تأثر نتائج القياس بالأداة
المستخدمة طالما أنها أداة مناسبة لتقدير الظاهرة ، كما يكون تدرج الأداة
بوحدات قياس متسـاوية لا تعتمد ولا تتأثر بالعناصر التي تقدر عندها
الظاهرة. ويذكر علام (2000) أن الموضوعية يقصد بها أن درجة الفرد في
الاختبار لا يجب أن تعتمد على عينة الأفراد ، ففي الاختبارات النفسية
المقننة تشتق الدرجات الخام من عينة التقنين ثم يوازن أداء الفرد الذي
يطبق عليه الاختبار فيما بعد بمعايير مشتقة من هذه العينة ، فإذا تغيرت
العينة فقدت هذه المعايير دلالتها ، أي يصبح الاختبار محكوماً بالعينة ،
كما أن الفرد يحصل على الدرجة نفسها في أي اختبارين يقيسان نفس السمة ،
إلا أن درجة الفرد تختلف عادة باختلاف الاختبار الذي يطبق عليه ، أي أن
درجته تصبح محكومة بعينة المفردات التي يختبر بها.
والقياس الموضوعي لا يعتمد في نظامه المرجعي على مقارنة نتائج أداء
المتعلم بأداء الجماعة ، أو بأداء الفرد ذاته في وقت لاحق أو في اختبار أو
مقياس آخر ، بل يعتمد على تقدير علاقة احتمالية بين (الأداء الملاحظ للفرد
في المقياس)و(السمات أو القدرات التي تكمن وراء هذا الأداء وتفسره) . وقد
أسفرت الجهود الباحثين عن ما يعرف باسم :
نظرية السمات الكامنة Latent Trait Theory
وأحيانا تسمى نظرية الاستجابة للمفردة
Item Response Theory(IRT)