Chulalongkorn University Theses and Dissertations (Chula ETD)
การประมาณค่าพารามิเตอร์ในตัวแบบการถดถอยโลจิสติคเมื่อมีค่าผิดปกติ
Other Title (Parallel Title in Other Language of ETD)
Estimation of parameters in logistic regression model having outliers
Year (A.D.)
2004
Document Type
Thesis
First Advisor
มานพ วราภักดิ์
Faculty/College
Faculty of Commerce and Accountancy (คณะพาณิชยศาสตร์และการบัญชี)
Degree Name
สถิติศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
สถิติ
DOI
10.58837/CHULA.THE.2004.598
Abstract
การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการประมาณค่าพารามิเตอร์ เมื่อมีค่าผิดปกติในตัวแปรอิสระของตัวแบบการถดถอยโลจิสติก โดยทำการเปรียบเทียบวิธีความควรจะเป็นสูงสุด (ML) วิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Croux และ Haesbroeck (WMLCH) และวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Rousseeuw และ Christmann (WMLRC) ซึ่งเกณฑ์การเปรียบเทียบ คือ ค่าเฉลี่ยของความคลาดเคลื่อนกำลังสองเฉลี่ย (AMSE) ของพารามิเตอร์ ในการวิจัยครั้งนี้มีตัวแปรอิสระ x[subscript 1] และ x[subscript 2] โดยกำหนดตัวแปรอิสระ x[subscript 1] และ x[subscript 2] มีการแจกแจงแบบไม่มีค่าผิดปกติและแบบมีค่าผิดปกติ ซึ่งกำหนดระดับค่าผิดปกติเป็นระดับไม่รุนแรงและระดับรุนแรง แต่ละระดับจะกำหนดให้มีสัดส่วนการปลอมปนของขนาดตัวอย่างคือ 0.05, 0.10 และ 0.15 และขนาดตัวอย่างเท่ากับ 20, 30, 40, 50, 60, 70, 80, 90 และ 100 ข้อมูลที่ใช้ในการวิจัยได้จากการจำลองและใช้วิธีมอนติคาร์โลในการหาค่า AMSE ซึ่งกระทำซ้ำ 1,000 ครั้ง ในแต่ละสถานการณ์ ผลการวิจัยปรากฏว่าระดับค่าผิดปกติ สัดส่วนการปลอมปน และขนาดตัวอย่าง ต่างมีผลต่อการประมาณค่าพารามิเตอร์ของทั้งสามวิธี โดยค่าเฉลี่ยของความคลาดเคลื่อนกำลังสองของพารามิเตอร์จะเพิ่มขึ้นเมื่อระดับค่าผิดปกติ และสัดส่วนการปลอมปนเพิ่มขึ้น แต่ละมีค่าลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น กรณีที่ไม่มีค่าผิดปกติในตัวแปรอิสระ x[subscript 1] และตัวแปรอิสระ x[subscript 2] ในทุกขนาดตัวอย่าง วิธี ML จะให้ค่า AMSE ต่ำที่สุด และเมื่อตัวอย่างใหญ่ขนาด 70 ขึ้นไป วิธี ML วิธี WMLCH และวิธี WMLRC จะมีค่า AMSE ใกล้เคียงกัน กรณีที่มีค่าผิดปกติในตัวแปรอิสระหนึ่งตัว ในทุกระดับค่าผิดปกติ สัดส่วนการปลอมปน และขนาดตัวอย่าง วิธี WMLRC จะให้ค่า AMSE ต่ำที่สุด และเมื่อตัวอย่างใหญ่ขนาด 60 ขึ้นไป วิธี WMLCH และวิธี WMLRC จะมีค่า AMSE ใกล้เคียงกัน กรณีที่มีค่าผิดปกติในตัวแปรอิสระ x[subscript 1] และตัวแปรอิสระ x[subscript 2] ในทุกระดับค่าผิดปกติ สัดส่วนการปลอมปน และขนาดตัวอย่าง วิธี WMLRC จะให้ค่า AMSE ต่ำที่สุด รองลงมาคือวิธี WMLCH และวิธี ML ตามลำดับ ทั้งนี้วิธี WMLCH และวิธี WMLRC จะมีค่า AMSE ใกล้เคียงกัน
Other Abstract (Other language abstract of ETD)
The objective of this research is to compare the estimation methods of parameters in the logistic regression model having outliers in independent variables. The estimation methods are Maximum Likelihood (ML) Method, Weighted Maximum Likelihood Method of Croux and Haesbroeck (WMLCH) and Weighted Maximum Likelihood Method of Rousseeuw and Christmann (WMLRC). The criterion of comparison is the average mean square error(AMSE) of parameters. There are two levels of outliers, mild and extreme, and three proportions of contamination 0.05, 0.10 and 0.15. The sample sizes are 20, 30, 40, 50, 60, 70 80, 90 and 100. The study used data from simulation and used the Monte Carlo method to compute AMSE. The experiment was repeated 1,000 times under each situations. The results of this research showed that the level of outliers, proportion of outliers contamination and sample sizes have effected on parameters estimates. The average values of mean square error of parameters increase when level of outliers and proportion of outliers contamination increase but they decrease when sample sizes increase. In case of no outliers in independent variable x[subscript 1] and x[subscript 2] For all sample sizes, AMSE of ML method is smallest. Whereas sample sizes more than 70, the AMSE of ML method, WMLCH method and WMLRC method are nearly the same. In case of one independent variable has outliers For all level of outliers, proportion of contamination and sample sizes, AMSE of WMLRC method is smallest. Whereas sample sizes more than 60, the AMSE of WMLCH method and WMLRC method are nearly the same. In case of independent variable x[subscript 1] and x[subscript 2] have outliers For all level of outliers, proportion of contamination and sample sizes, The smallest AMSE is WMLRC method, WMLCH method and ML method respectively. Whereas the AMSE of WMLCH method and WMLRC method are nearly the same.
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
เกตุสุข, อรนิต, "การประมาณค่าพารามิเตอร์ในตัวแบบการถดถอยโลจิสติคเมื่อมีค่าผิดปกติ" (2004). Chulalongkorn University Theses and Dissertations (Chula ETD). 18610.
https://digital.car.chula.ac.th/chulaetd/18610