Chulalongkorn University Theses and Dissertations (Chula ETD)
การเปรียบเทียบวิธีการรวมตัวแบบการถดถอยเชิงเส้นพหุคูณ
Other Title (Parallel Title in Other Language of ETD)
A comparison of model combining methods for multiple linear regression models
Year (A.D.)
2007
Document Type
Thesis
First Advisor
มานพ วราภักดิ์
Faculty/College
Faculty of Commerce and Accountancy (คณะพาณิชยศาสตร์และการบัญชี)
Degree Name
สถิติศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
สถิติ
DOI
10.58837/CHULA.THE.2007.598
Abstract
การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีหาค่าพยากรณ์ร่วมของตัวแบบการถดถอยเชิงเส้นพหุคูณ 3 วิธี ได้แก่ วิธีค่าสัมบูรณ์ต่ำสุด (LAE) วิธีบูตสแตรป (BO) และวิธี adaptive regression by mixing (ARM) โดยตัวแบบที่นำมาหาค่าพยากรณ์ร่วมได้แก่ ตัวแบบที่ได้จากวิธีพิจารณาการถดถอยทุกรูปแบบ วิธีคัดเลือกตัวแปรแบบไปข้างหน้า วิธีกำจัดตัวแปรแบบถอยหลัง และวิธีการถดถอยขั้นบันได ซึ่งเกณฑ์ที่ใช้ในการตัดสินใจ คือ เกณฑ์ร้อยละของความคลาดเคลื่อนเฉลี่ยสัมบูรณ์ (MAPE) จำนวนตัวแปรอิสระที่ศึกษาคือ 3, 5 และ 7 ตัว เมื่อจำนวนตัวแปรอิสระเท่ากับ 3 กำหนดระดับความสัมพันธ์ระหว่างตัวแปรอิสระ x[subscript 1] กับ x[subscript 2] เท่ากับ 0.3, 0.5 และ 0.8 โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 14, 20, 30, 40 และ 50 เมื่อจำนวนตัวแปรอิสระเท่ากับ 5 กำหนดระดับความสัมพันธ์ระหว่าง x[subscript 1] กับ x[subscript 2] และ x[subscript 4] กับ x[subscript 5] เท่ากับ (0.3, 0.3), (0.4, 0.6) และ (0.7, 0.9) โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 20, 30, 40 และ 50 เมื่อจำนวนตัวแปรอิสระเท่ากับ 7 กำหนดระดับความสัมพันธ์ระหว่าง x[subscript 1] กับ x[subscript 2], x[subscript 4] กับ x[subscript 5] และ x[subscript 6] กับ x[subscript 7] เท่ากับ (0.3, 0.3, 0.3), (0.4, 0.5, 0.6) และ (0.7, 0.8, 0.9) โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 30, 40 และ 50 ความคลาดเคลื่อนมีการแจกแจงปกติที่มีค่าเฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 5 วิธีการวิจัยใช้การจำลองด้วยเทคนิคมอนติคาร์โลซึ่งกระทำซ้ำ 1,000 รอบในแต่ละสถานการณ์ ผลการวิจัยปรากฏว่าปัจจัยที่มีผลต่อค่าเฉลี่ยของ MAPE ของทุกวิธี คือ ระดับความสัมพันธ์ระหว่างตัวแปรอิสระและขนาดตัวอย่าง โดยค่าเฉลี่ยของ MAPE จะมีแนวโน้มเพิ่มขึ้นเมื่อระดับความสัมพันธ์สูงขึ้น และมีแนวโน้มลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น จากการเปรียบเทียบค่าเฉลี่ยของ MAPE ของการหาค่าพยากรณ์ร่วม 3 วิธี พบว่า วิธี BO มีประสิทธิภาพมากที่สุดในทุกกรณีที่ศึกษา และโดยทั่วไปวิธีพยากรณ์เดี่ยวที่ได้รับน้ำหนักมากที่สุดจะขึ้นอยู่กับระดับพหุสัมพันธ์ระหว่างตัวแปรอิสระ ดังนี้ กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับต่ำ วิธีพิจารณาการถดถอยทุกรูปแบบจะได้รับน้ำหนักมากที่สุด กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับปานกลาง วิธีกำจัดตัวแปรแบบถอยหลังจะได้รับน้ำหนักมากที่สุด กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับสูง วิธีการถดถอยขั้นบันไดจะได้รับน้ำหนักมากที่สุด
Other Abstract (Other language abstract of ETD)
The objective of this research is to compare model-combining methods for multiple linear regression models. Three combining methods are studied: least absolute errors (LAE), combination by bootstrap (BO) and adaptive regression by mixing (ARM). The models used in combining are built by the following procedures: all possible regressions, forward selection, backward elimination and stepwise regression. The mean absolute percentage error (MAPE) is used as the criterion in deciding which combining method is best. The number of independent variables are 3, 5 and 7. In 3-variable case, the correlations between independent variables x[subscript 1] and x[subscript 2] are 0.3, 0.5 and 0.8; the sample sizes are 14, 20, 30, 40 and 50. In 5-variable case, the correlations between x[subscript 1] and x[subscript 2], and between x[subscript 4] and x[subscript 5] are (0.3, 0.3), (0.4, 0.6) and (0.7, 0.9); the sample sizes are 20, 30, 40 and 50. In 7-variable case, the correlations between x[subscript 1] and x[subscript 2], between x[subscript 4] and x[subscript 5], and between x[subscript 6] and x[subscript 7] are (0.3, 0.3, 0.3), (0.4, 0.5, 0.6) and (0.7, 0.8, 0.9); the sample sizes are 30, 40 and 50. The random errors are normally distributed with mean 0 and standard deviation 5. This research used the Monte Carlo simulation, repeated 1,000 times in each situation. The results of this research show that factors affecting the average of MAPE for all combining methods are correlations among the independent variables and sample sizes. The average of MAPE tends to increase when the correlation increases, and to fall when the sample size increases. By comparing the average of MAPE for the three combining methods, the researcher concludes that BO method is the best in every case. Generally, the model-building procedure which receives the maximum weight depends on the degree of multicollinearity among the independent variables. When multicollinearity is low, all possible regression receives the maximum weight. When multicollinearity is medium, backward elimination receives the maximum weight. When multicollinearity is high, stepwise regression receives the maximum weight
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
อัครเดชากร, ธนาพันธ์, "การเปรียบเทียบวิธีการรวมตัวแบบการถดถอยเชิงเส้นพหุคูณ" (2007). Chulalongkorn University Theses and Dissertations (Chula ETD). 18832.
https://digital.car.chula.ac.th/chulaetd/18832