Chulalongkorn University Theses and Dissertations (Chula ETD)
Other Title (Parallel Title in Other Language of ETD)
The development of modified let omit method as an alternative for the partial credit scoring methods of multiple true-false test
Year (A.D.)
2021
Document Type
Thesis
First Advisor
ณัฏฐภรณ์ หลาวทอง
Faculty/College
Faculty of Education (คณะครุศาสตร์)
Department (if any)
Department of Educational Research and Psychology (ภาควิชาวิจัยและจิตวิทยาการศึกษา)
Degree Name
ครุศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิธีวิทยาการพัฒนานวัตกรรมทางการศึกษา
DOI
10.58837/CHULA.THE.2021.882
Abstract
การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบคุณสมบัติทางจิตมิติของแบบสอบถูกผิดหลายตัวเลือกที่มีวิธีการให้คะแนนความรู้บางส่วน 4 วิธี ประกอบด้วย วิธีการนับ 2 (Count-2) วิธีการให้คะแนนบางส่วน 50 (PS50) วิธีการเพิ่มคะแนนตัวเลือกที่เว้นไว้ (LO) และวิธีประยุกต์การเพิ่มคะแนนตัวเลือกที่เว้นไว้ (MLO) ตัวอย่างวิจัย ได้แก่ นักเรียนชั้นมัธยมศึกษาปีที่ 6 แผนการเรียนคณิตศาสตร์ -วิทยาศาสตร์ จำนวน 1,178 คน เครื่องมือวิจัย ได้แก่ แบบสอบถูกผิดหลายตัวเลือก เรื่องเคมีอินทรีย์ จำนวน 20 ข้อ การวิเคราะห์ข้อมูลประกอบด้วยการวิเคราะห์สถิติพื้นฐานของคะแนนสอบ ด้วยโปรแกรม Microsoft Excel และ SPSS การวิเคราะห์คุณสมบัติทางจิตมิติ ได้แก่ ความยาก (b) อำนาจจำแนก (a) ฟังก์ชันสารสนเทศของข้อสอบ (IIF) ฟังก์ชันสารสนเทศของแบบสอบ (TIF) สัมประสิทธิ์ความเที่ยง โดยวิเคราะห์ตามทฤษฎีการตอบสนองข้อสอบ โมเดล G-PCM ด้วยโปรแกรม R วิเคราะห์เปรียบเทียบคุณสมบัติทางจิตมิติ สัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาค และความสัมพันธ์ระหว่างคะแนนสอบที่ได้จากการตรวจให้คะแนนทั้ง 4 วิธีกับเกรดวิชาเคมี การเรียนพิเศษวิชาเคมี และความรู้สึกต่อวิชาเคมี ด้วยโปรแกรม SPSS ผลการวิจัยสรุปได้ ดังนี้ 1. ผลการวิเคราะห์สถิติพื้นฐานของคะแนน พบว่า เมื่อตรวจให้คะแนนด้วยวิธี MLO คะแนนจะมีค่าเฉลี่ยสูงสุด (12.05) และเมื่อวิเคราะห์ความสัมพันธ์ระหว่างคะแนนเมื่อตรวจให้คะแนนทั้ง 4 วิธี พบว่า คะแนนที่ได้เมื่อตรวจให้คะแนนแต่ละวิธีมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 โดยมีความสัมพันธ์กันสูงถึงสูงมาก 2. ผลการวิเคราะห์และเปรียบเทียบความยากและอำนาจจำแนก พบว่า ข้อสอบมีความยากเฉลี่ยและอำนาจจำแนกเฉลี่ยสูงสุดเมื่อตรวจให้คะแนนด้วย PS50 (b = 0.39, a = 0.95) รองลงมาคือ วิธี Count-2 (b = 0.39, a = 0.64) วิธี MLO (b = -1.06 , a = 0.25) และ LO (b = -0.66, a = 0.27) ตามลำดับ เมื่อเปรียบเทียบความยากและอำนาจจำแนก พบว่า ทั้งความยากและอำนาจจำแนกของข้อสอบแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 ระหว่าง Count-2 และ LO, Count-2 และ MLO, PS50 และ LO, PS50 และ MLO 3. ผลการวิเคราะห์ฟังก์ชันสารสนเทศของข้อสอบ พบว่า วิธี Count-2 และ PS50 ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถปานกลาง ส่วนวิธี LO และ MLO ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถต่ำถึงปานกลาง ข้อสอบที่ให้สารสนเทศสูงสุดคือ ข้อที่ 5 และข้อสอบที่ให้สารสนเทศต่ำสุดคือ ข้อที่ 20 เช่นเดียวกันทั้ง 4 วิธี ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 เมื่อเปรียบเทียบสารสนเทศข้อสอบ พบว่า ที่ระดับความสามารถต่ำมีข้อสอบ 8 ข้อ ที่ระดับความสามารถปานกลางมีข้อสอบ 14 ข้อ และที่ระดับความสามารถสูงมีข้อสอบ 7 ข้อ ที่มีวิธีการตรวจให้คะแนนอย่างน้อย 1 คู่ที่มีค่าฟังก์ชันสารสนเทศแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 4. ผลการวิเคราะห์และเปรียบเทียบความเที่ยง พบว่า ทั้งสัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาคและสัมประสิทธิ์ความเที่ยง IRT ของแบบสอบเมื่อตรวจให้คะแนนทั้ง 4 วิธี มีค่าสูงกว่า .70 โดยวิธี Count-2 มีสัมประสิทธิ์ความเที่ยงสูงที่สุด และค่าสัมประสิทธิ์แอลฟาของครอนบาคของแต่ละวิธีไม่แตกต่างกันที่ระดับนัยสำคัญทางสถิติ .01 5. ผลการวิเคราะห์และเปรียบเทียบฟังก์ชันสารสนเทศของแบบสอบ พบว่า ที่ระดับความสามารถต่ำ (θ < -1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี MLO ที่ระดับความสามารถปานกลาง (-1 ≤ θ ≤ 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 และที่ระดับความสามารถสูง (θ > 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี PS50 แต่เมื่อเปรียบเทียบ TIF เมื่อตรวจให้คะแนนทั้ง 4 วิธีพบว่า ไม่แตกต่างกันทุกระดับความสามารถ และไม่พบปฏิสัมพันธ์ระหว่างวิธีการตรวจให้คะแนนและระดับความสามารถของผู้สอบ ที่ระดับนัยสำคัญทางสถิติ .01
Other Abstract (Other language abstract of ETD)
The purpose of this study was to compare the psychometric properties of the multiple true-false test with 4 partial scoring methods were Count-2, Partial Scoring 50 (PS50), Let Omit (LO) and Modified Let Omit (MLO). The sample were 1,178 twelfth grade Mathematic-Science program students. Research instrument was “Organic Chemistry” Multiple True-False test with 20 items. Descriptive statistic of score were analyzed by Microsoft Excel and SPSS. Difficulty (b), Discrimination (a), Item Information Function (IIF), Test Information Function (TIF) and Reliability Coefficent were analyzed using the Generalized Partial Credit Model (G-PCM) in R programing. Psychometric properties comparing, Cronbach’s alpha coefficient and Correlation between score and other variables: Chemical grade, Extra study and Feeling towards chemistry were analyzed using SPSS. The results revealed that 1. MLO produced highest mean score (12.05). Spearman’s Correlation Coefficient and Pearson’s Correlation Coefficient showed the score from each method had high to very high correlation. 2. Partial Scoring 50 method had highest average difficulty index and discrimination index (b = 0.39, a = 0.95) followed by Count-2 (b = 0.39, a = 0.64), MLO (b = -1.06, a = 0.25) and LO (b = -0.66, a = 0.27) respectively. Difficulty index and discrimination index were different statisticaly significant at the .01 level between Count-2 and LO, Count-2 and MLO, PS50 and LO, PS50 and MLO. 3. Most items provided the highest item information in moderate ability when using Count-2 and PS50. LO and MLO created the highest item information in low to moderate ability. Item 5 produced the highest item information and item 20 produced the lowest item information for every methods. Most items had the highest item information when using Count-2. Eight items from low ability, 14 items from moderate ability and seven items from high ability were different statisticaly significant at the .01 level at least a pair of method. 4. Both Cronbach’s alpha coefficient and IRT reliability coefficient was produced by each method higher than .07. Count-2 had highest reliability coefficient. Cronbach’s alpha coefficient from all methods were not different statisticaly significant at the .01 level. 5. At low ability, MLO provided the highest test information function. Count-2 created the highest test information function in moderate ability. At high ability, the highest test information function produced by PS50. All methods were not different statisticaly significant at the .01 level. Moreover the interactive between scoring method and ability wasn’t found statisticaly significant at the .01.
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
บวรธรรมรัตน์, ภัคจิรา, "การพัฒนาวิธีการปรับการให้คะแนนจากตัวเลือกที่เว้นไว้สำหรับเป็นทางเลือกในการตรวจให้คะแนนความรู้บางส่วนของแบบสอบถูกผิดหลายตัวเลือก" (2021). Chulalongkorn University Theses and Dissertations (Chula ETD). 5424.
https://digital.car.chula.ac.th/chulaetd/5424