Chulalongkorn University Theses and Dissertations (Chula ETD)
การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามระหว่างดัชนีพาสเกลจีสแควร์และดัชนีเอสไคสแควร์ทั่วไป
Other Title (Parallel Title in Other Language of ETD)
The comparison of item fit index efficiency between parscale G² and generalized S-X²
Year (A.D.)
2011
Document Type
Thesis
First Advisor
ณัฏฐภรณ์ หลาวทอง
Faculty/College
Faculty of Education (คณะครุศาสตร์)
Degree Name
ครุศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
การวัดและประเมินผลการศึกษา
DOI
10.58837/CHULA.THE.2011.31
Abstract
การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถาม (item fit index) สองชนิดคือ ดัชนีพาสเกลจีสแควร์และดัชนีเอสไคสแควร์ทั่วไป ข้อมูลที่ใช้ในการศึกษาจำลองภายใต้โมเดลทฤษฎีการตอบสนองข้อสอบแบบพหุวิภาค 2 โมเดล คือ Grade Response Model (GRM) และ Generalized Partial Credit Model (GPCM) จัดกระทำข้อมูลตาม 3 เงื่อนไข คือ 1) ความยาวแบบวัด 3 ระดับ คือ 10, 20, และ 40 ข้อ 2) ขนาดกลุ่มตัวอย่าง 3 ระดับ คือ 500, 1000, และ 2000 คน 3) จำนวนรายการคำตอบ 4 ระดับ คือ 3, 5, 7, และ 9 รายการ รวมข้อมูลที่ศึกษาทั้งหมด 72 สถานการณ์ เกณฑ์ที่นำมาใช้ในการประเมินประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถาม คือค่าความคลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบ โดยใช้การเปรียบเทียบ 2 กรณี คือ 1.การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามทั้งสองชนิดตามเงื่อนไขของ Kang และ Chen (2008) และ 2.การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามทั้งสองชนิดโดยใช้สถิติการวิเคราะห์ความแปรปรวนแบบ 2 ทางผลการวิจัยพบว่า 1. ในการเปรียบเทียบประสิทธิภาพตามเงื่อนไขของ Kang และ Chen (2008) ดัชนีเอสไคสแควร์ทั่วไปมีประสิทธิภาพในการบ่งชี้ความสอดคล้องของข้อคำถามมากกว่าดัชนีพาสเกลจีสแควร์ในเกือบทุกสถานการณ์ที่ทำการศึกษาเนื่องจากดัชนีเอสไคสแควร์ทั่วไปมีค่าความคลาดเคลื่อนประเภทที่ 1 ในการบ่งชี้ความสอดคล้องของข้อคำถามน้อยกว่าดัชนีพาสเกลจีสแควร์ ใน 70 สถานการณ์ จากทั้งหมด 72 สถานการณ์ (ค่าเฉลี่ยของค่าความคลาดเคลื่อนประเภทที่ 1 ใน 72 สถานการณ์ของดัชนีพาสเกลจีสแควร์ = 0.1535, ค่าเฉลี่ยของค่าความคลาดเคลื่อนประเภทที่ 1 ใน 72 สถานการณ์ของดัชนีเอสไคสแควร์ทั่วไป = 0.0216) 2. ในการเปรียบเทียบประสิทธิภาพโดยใช้สถิติการวิเคราะห์ความแปรปรวนแบบ 2 ทาง ดัชนีเอสไคสแควร์ทั่วไปให้ค่าความคลาดเคลื่อนประเภทที่ 1 น้อยกว่าดัชนีพาสเกลจีสแควร์ใน 5 กรณีที่ทำการศึกษา และดัชนีพาสเกลจีสแควร์ให้อำนาจการทดสอบที่สูงกว่าดัชนีเอสไคสแควร์ทั่วไปทั้ง 6 กรณีที่ทำการศึกษา 3. ดัชนีเอสไคสแควร์ทั่วไปมีโอกาสในการบ่งชี้ข้อคำถามที่สอดคล้องกับโมเดลว่าเป็นข้อคำถามที่ไม่สอดคล้องกับโมเดลน้อยกว่าดัชนีพาสเกลจีสแควร์ (ดัชนีเอสไคสแควร์ทั่วไปมีค่าความคลาดเคลื่อนประเภทที่ 1 น้อยกว่าดัชนีพาสเกลจีสแควร์) ในขณะที่ดัชนีพาสเกลจีสแควร์มีโอกาสในการบ่งชี้ข้อคำถามที่ไม่สอดคล้องกับโมเดลว่าเป็นข้อคำถามที่ไม่สอดคล้องกับโมเดลมากกว่าดัชนีเอสไคสแควร์ทั่วไป (ดัชนีพาสเกลจีสแควร์มีอำนาจการทดสอบมากกว่าดัชนีเอสไคสแควร์ทั่วไป)
Other Abstract (Other language abstract of ETD)
The purpose of this research was to compare the efficiency of two item fit indices-PARSCALE G² and GENERALIZED S-X². Data were simulated under two Polytomous item response theory models- Grade response model (GRM) and Generalized partial credit model (GPCM). Three conditions were manipulated: 1) three levels of test length (10, 20 and 40), 2) three levels of sample size (500, 1000 and 2000), 3) four levels of category (3, 5, 7 and 9). Seventy-two situations were analyzed. Type I error and power of the test were used as criteria to evaluate the efficiency of item fit index in this research in 1) the comparisons of two item fit indices efficiency by Kang and Chen (2008)’ s condition, and 2) the comparisons of two item fit indices efficiency in two-way ANOVA.The results of this research were : 1. The comparisons of two item fit indices efficiency in Kang and Chen (2008)’ s condition, GENERALIZED S-X² had more efficiency than PARSCALE G² in most situations due to the fact that the type I error of GENERALIZED S-X² was less than the type I error of PARSCALE G² in 70 situations out of 72 situations (mean of PARSCALE G² ‘ s type I error = 0.1535, mean of GENERALIZED S-X² ‘s type I error = 0.0216). 2. The comparisons of two item fit indices efficiency in two-way ANOVA, type I error of GENERALIZED S-X² was less than the type I error of PARSCALE G² in 5 cases of 6 cases, and the power of the test of PARSCALE G² was greater than the power of the test of GENERALIZED S-X² in all 6 cases. 3. GENERALIZED S-X² had probability to indicate the fitted items were misfitted items less than PARSCALE G² (GENERALIZED S-X² had type I error less than PARSCALE G²). While PARSCALE G² had probability to indicate the misfitted items were misfitted items more than GENERALIZED S-X² (PARSCALE G² had power of the test more than GENERALIZED S-X²).
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
จาบประไพ, ธีรนุช, "การเปรียบเทียบประสิทธิภาพของดัชนีความสอดคล้องของข้อคำถามระหว่างดัชนีพาสเกลจีสแควร์และดัชนีเอสไคสแควร์ทั่วไป" (2011). Chulalongkorn University Theses and Dissertations (Chula ETD). 34928.
https://digital.car.chula.ac.th/chulaetd/34928