Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

The development of modified let omit method as an alternative for the partial credit scoring methods of multiple true-false test

Year (A.D.)

2021

Document Type

Thesis

First Advisor

ณัฏฐภรณ์ หลาวทอง

Faculty/College

Faculty of Education (คณะครุศาสตร์)

Department (if any)

Department of Educational Research and Psychology (ภาควิชาวิจัยและจิตวิทยาการศึกษา)

Degree Name

ครุศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิธีวิทยาการพัฒนานวัตกรรมทางการศึกษา

DOI

10.58837/CHULA.THE.2021.882

Abstract

การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบคุณสมบัติทางจิตมิติของแบบสอบถูกผิดหลายตัวเลือกที่มีวิธีการให้คะแนนความรู้บางส่วน 4 วิธี ประกอบด้วย วิธีการนับ 2 (Count-2) วิธีการให้คะแนนบางส่วน 50 (PS50) วิธีการเพิ่มคะแนนตัวเลือกที่เว้นไว้ (LO) และวิธีประยุกต์การเพิ่มคะแนนตัวเลือกที่เว้นไว้ (MLO) ตัวอย่างวิจัย ได้แก่ นักเรียนชั้นมัธยมศึกษาปีที่ 6 แผนการเรียนคณิตศาสตร์ -วิทยาศาสตร์ จำนวน 1,178 คน เครื่องมือวิจัย ได้แก่ แบบสอบถูกผิดหลายตัวเลือก เรื่องเคมีอินทรีย์ จำนวน 20 ข้อ การวิเคราะห์ข้อมูลประกอบด้วยการวิเคราะห์สถิติพื้นฐานของคะแนนสอบ ด้วยโปรแกรม Microsoft Excel และ SPSS การวิเคราะห์คุณสมบัติทางจิตมิติ ได้แก่ ความยาก (b) อำนาจจำแนก (a) ฟังก์ชันสารสนเทศของข้อสอบ (IIF) ฟังก์ชันสารสนเทศของแบบสอบ (TIF) สัมประสิทธิ์ความเที่ยง โดยวิเคราะห์ตามทฤษฎีการตอบสนองข้อสอบ โมเดล G-PCM ด้วยโปรแกรม R วิเคราะห์เปรียบเทียบคุณสมบัติทางจิตมิติ สัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาค และความสัมพันธ์ระหว่างคะแนนสอบที่ได้จากการตรวจให้คะแนนทั้ง 4 วิธีกับเกรดวิชาเคมี การเรียนพิเศษวิชาเคมี และความรู้สึกต่อวิชาเคมี ด้วยโปรแกรม SPSS ผลการวิจัยสรุปได้ ดังนี้ 1. ผลการวิเคราะห์สถิติพื้นฐานของคะแนน พบว่า เมื่อตรวจให้คะแนนด้วยวิธี MLO คะแนนจะมีค่าเฉลี่ยสูงสุด (12.05) และเมื่อวิเคราะห์ความสัมพันธ์ระหว่างคะแนนเมื่อตรวจให้คะแนนทั้ง 4 วิธี พบว่า คะแนนที่ได้เมื่อตรวจให้คะแนนแต่ละวิธีมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 โดยมีความสัมพันธ์กันสูงถึงสูงมาก 2. ผลการวิเคราะห์และเปรียบเทียบความยากและอำนาจจำแนก พบว่า ข้อสอบมีความยากเฉลี่ยและอำนาจจำแนกเฉลี่ยสูงสุดเมื่อตรวจให้คะแนนด้วย PS50 (b = 0.39, a = 0.95) รองลงมาคือ วิธี Count-2 (b = 0.39, a = 0.64) วิธี MLO (b = -1.06 , a = 0.25) และ LO (b = -0.66, a = 0.27) ตามลำดับ เมื่อเปรียบเทียบความยากและอำนาจจำแนก พบว่า ทั้งความยากและอำนาจจำแนกของข้อสอบแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 ระหว่าง Count-2 และ LO, Count-2 และ MLO, PS50 และ LO, PS50 และ MLO 3. ผลการวิเคราะห์ฟังก์ชันสารสนเทศของข้อสอบ พบว่า วิธี Count-2 และ PS50 ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถปานกลาง ส่วนวิธี LO และ MLO ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถต่ำถึงปานกลาง ข้อสอบที่ให้สารสนเทศสูงสุดคือ ข้อที่ 5 และข้อสอบที่ให้สารสนเทศต่ำสุดคือ ข้อที่ 20 เช่นเดียวกันทั้ง 4 วิธี ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 เมื่อเปรียบเทียบสารสนเทศข้อสอบ พบว่า ที่ระดับความสามารถต่ำมีข้อสอบ 8 ข้อ ที่ระดับความสามารถปานกลางมีข้อสอบ 14 ข้อ และที่ระดับความสามารถสูงมีข้อสอบ 7 ข้อ ที่มีวิธีการตรวจให้คะแนนอย่างน้อย 1 คู่ที่มีค่าฟังก์ชันสารสนเทศแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 4. ผลการวิเคราะห์และเปรียบเทียบความเที่ยง พบว่า ทั้งสัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาคและสัมประสิทธิ์ความเที่ยง IRT ของแบบสอบเมื่อตรวจให้คะแนนทั้ง 4 วิธี มีค่าสูงกว่า .70 โดยวิธี Count-2 มีสัมประสิทธิ์ความเที่ยงสูงที่สุด และค่าสัมประสิทธิ์แอลฟาของครอนบาคของแต่ละวิธีไม่แตกต่างกันที่ระดับนัยสำคัญทางสถิติ .01 5. ผลการวิเคราะห์และเปรียบเทียบฟังก์ชันสารสนเทศของแบบสอบ พบว่า ที่ระดับความสามารถต่ำ (θ < -1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี MLO ที่ระดับความสามารถปานกลาง (-1 ≤ θ ≤ 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 และที่ระดับความสามารถสูง (θ > 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี PS50 แต่เมื่อเปรียบเทียบ TIF เมื่อตรวจให้คะแนนทั้ง 4 วิธีพบว่า ไม่แตกต่างกันทุกระดับความสามารถ และไม่พบปฏิสัมพันธ์ระหว่างวิธีการตรวจให้คะแนนและระดับความสามารถของผู้สอบ ที่ระดับนัยสำคัญทางสถิติ .01

Other Abstract (Other language abstract of ETD)

The purpose of this study was to compare the psychometric properties of the multiple true-false test with 4 partial scoring methods were Count-2, Partial Scoring 50 (PS50), Let Omit (LO) and Modified Let Omit (MLO). The sample were 1,178 twelfth grade Mathematic-Science program students. Research instrument was “Organic Chemistry” Multiple True-False test with 20 items. Descriptive statistic of score were analyzed by Microsoft Excel and SPSS. Difficulty (b), Discrimination (a), Item Information Function (IIF), Test Information Function (TIF) and Reliability Coefficent were analyzed using the Generalized Partial Credit Model (G-PCM) in R programing. Psychometric properties comparing, Cronbach’s alpha coefficient and Correlation between score and other variables: Chemical grade, Extra study and Feeling towards chemistry were analyzed using SPSS. The results revealed that 1. MLO produced highest mean score (12.05). Spearman’s Correlation Coefficient and Pearson’s Correlation Coefficient showed the score from each method had high to very high correlation. 2. Partial Scoring 50 method had highest average difficulty index and discrimination index (b = 0.39, a = 0.95) followed by Count-2 (b = 0.39, a = 0.64), MLO (b = -1.06, a = 0.25) and LO (b = -0.66, a = 0.27) respectively. Difficulty index and discrimination index were different statisticaly significant at the .01 level between Count-2 and LO, Count-2 and MLO, PS50 and LO, PS50 and MLO. 3. Most items provided the highest item information in moderate ability when using Count-2 and PS50. LO and MLO created the highest item information in low to moderate ability. Item 5 produced the highest item information and item 20 produced the lowest item information for every methods. Most items had the highest item information when using Count-2. Eight items from low ability, 14 items from moderate ability and seven items from high ability were different statisticaly significant at the .01 level at least a pair of method. 4. Both Cronbach’s alpha coefficient and IRT reliability coefficient was produced by each method higher than .07. Count-2 had highest reliability coefficient. Cronbach’s alpha coefficient from all methods were not different statisticaly significant at the .01 level. 5. At low ability, MLO provided the highest test information function. Count-2 created the highest test information function in moderate ability. At high ability, the highest test information function produced by PS50. All methods were not different statisticaly significant at the .01 level. Moreover the interactive between scoring method and ability wasn’t found statisticaly significant at the .01.

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.