อิทธิพลของการทำหน้าที่ต่างกันของข้อสอบที่ส่งผลต่อคุณภาพของแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนระดับชาติ ชั้นประถม ศึกษาปีที่ 6

The effect of differential item functioning on the quality of a national achievement test for grade 6 students

Authors

  • ศุภวัฒน์ มะลิเผือก

Keywords:

ข้อสอบ, แบบทดสอบ, ผลสัมฤทธิ์ทางการเรียน, การศึกษา, แบบทดสอบ. การวัดผลทางการศึกษา, การศึกษาขั้นมัธยม

Abstract

การวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาอิทธิพลของการทำหน้าที่ต่างกันของข้อสอบที่ส่งผลต่อคุณภาพแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนระดับชาติ โดยเปรียบเทียบค่าความเที่ยงของแบบทดสอบ ความตรงเชิงโครงสร้าง ความคงที่ของโครงสร้างองค์ประกอบและค่าสัมประสิทธิ์สหสัมพันธ์อันดับของผู้สอบ ระหว่างแบบทดสอบฉบับก่อนกับฉบับหลังตัดข้อสอบทำหน้าที่ต่างกันออกจากแบบทดสอบ กลุ่มตัวอย่างเป็นผลการตอบแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนระดับชาติ วิชาภาษาไทย ของนักเรียนชั้นประถมศึกษาปีที 6 สังกัดสำนักงานเขตพื้นที่การศึกษานครศรีธรรมราช ปีการศึกษา 2546 จำนวน 2,000 คน วิเคราะห์ค่าสถิติพื้นฐานโดยใช้โปรแกรม SPSS วิเคราะห์ค่าสถิติของข้อสอบและค่าความเที่ยงของแบบทดสอบโดยใช้โปรแกรม Lertap 5 ตรวจสอบความเชิงโครงสร้างด้วยการวิเคราะห์องค์ประกอบเชิงยืนยันอันดับสองโดยใช้โปรแกรม LISREL 8.50 และตรวจสอบการทำหน้าที่ต่างกันของข้อสอบโดยใช้โปรแกรม SIBTEST และ SPSS   ผลการวิจัยปรากฏว่า  1. มีข้อสอบทำหน้าที่ต่างกันในแบบทดสอบวัดผลสัมฤทธิ์ทางการเรียนระดับชาติ ชั้นประถมศึกษาปีที่ 6 วิชาภาษาไทย จำนวน 12 ข้อ (ร้อยละ 30) เมื่อจำแนกกลุ่มผู้สอบตามตัวแปรเพศ  2. แบบทดสอบฉบับก่อนกับฉบับหลังตัดข้อสอบทำหน้าที่ต่างกัน มีค่าความเที่ยงแตกต่างกัน  3. แบบทดสอบฉบับก่อนกับฉบับหลังตัดข้อสอบทำหน้าที่ต่างกัน มีความตรงเชิงโครงสร้างไม่แตกต่างกัน  4. แบบทดสอบฉบับก่อนกับฉบับหลังตัดข้อสอบทำหน้าที่ต่างกัน มีโครงสร้างองค์ประกอบคงที่  5. ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของผู้สอบระหว่างแบบทดสอบฉบับก่อนกับฉบับหลังตัดข้อสอบทำหน้าที่ต่างกัน มีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ        The purpose of this research was to determine the effect of differential item functioning (DIF) on the quality of a national achievement test by comparing the test reliability index, construct validity measure, invariance of factor construct, and rank correlation coefficient before and after the DIF items were eliminated. The sample involved 2,000 Grade 6 students who sat a national achievement test on the Thai Language in the Nakhon Si Thammarat Education Service Area Office, academic year 2003. Descriptive statistics were derived by using SPSS, item analysis and test reliability were determined by using Lertap 5, while a second-order confirmatory factor analysis for construct validity was conducted by applying LISREL 8.50. SIBTEST and SPSS were used to detect differential item functioning.  Results:  1. Twelve items (30% of all test items) exhibited DIF when students were classified by gender. 2. The reliability index of the test before and after DIF items were eliminated was significantly different.  3. The construct validity of the test before and after DIF items were eliminated was similar.  4. The factor construct of the test before and after DIF items were eliminated was invariant.  5. The rank correlation coefficient of examinees between the test before and after DIF items were eliminated was significantly different.

Downloads

Published

2021-04-30