Chulalongkorn University Theses and Dissertations (Chula ETD)

การเปรียบเทียบวิธีตรวจสอบข้อมูลผิดปกติ ในการวิเคราะห์ความถดถอยเชิงเส้น

Other Title (Parallel Title in Other Language of ETD)

A comparative study on some procedures for detedcting outliers in liear regression analysis

Year (A.D.)

1991

Document Type

Thesis

First Advisor

ธีระพร วีระถาวร

Faculty/College

Graduate School (บัณฑิตวิทยาลัย)

Degree Name

สถิติศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

สถิติ

DOI

10.58837/CHULA.THE.1991.797

Abstract

ในงานวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบอำนาจการทดสอบของตัวสถิติทดสอบ 3 วิธีการ คือ วิธีการของทิตเจน มัวร์ และเบศแมน (TMB) วิธีการของเมอริน จี มาราขิงห์ (M) และวิธีการของจีแบร์รี (GB) ซึ่งใช้ตรวจสอบข้อมูลผิดปกติในการวิเคราะห์ความถดถอยเชิงเส้นอย่างง่าย โดยจะศึกษาในกรณีการแจกแจงของความผิดพลาดมี 2 ลักษณะ คือ การแจกแจงแบบหางยาวกว่าการแจกแจงปกติ และการแจกแจงแบบเบียวา ซึ่งในแต่ละลักษณะจะศึกษาในกรณีที่มีจำนวนข้อมูลผิดปกติ 1, 2 และ 3 ค่า ตามลำดับ ผลการวิจัยสรุปได้ดังนี้ ก) กรณีที่ความผิดพลาดมีการแจกแจงแบบหางยาวกว่าการแจกแจงปกติ ในงานวิจัยครั้งนี้ใช้การแจกแจงแบบสเกลคอนทามิเนตนอร์มอล โลเคชันคอนทามิเนตนอร์มอลและที โดยทั่วไปของทุกการแจกแจงแบบหางยาวที่ศึกษาพบว่าตัวสถิติทดสอบ M และ GB สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกัน ส่วนตัวสถิติทดสอบ TMB ควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภท 1 ได้น้อย ยกเว้นเมื่อใช้การแจกแจงแบบที จะสามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกับตัวสถิติทดสอบ M และ GB ผลการเปรียบเทียบค่าอำนาจการทดสอบพบว่ากรณีที่มีจำนวนค่าผิดปกติ (k)=1 ตัวสถิติทดสอบ GB มีอำนาจการทดสอบสูงสุด รองลงมาคือตัวสถิติทดสอบ TMB และ M ตามลำดับ ส่วนกรณีที่มีจำนวนค่าผิดปกติ (k)=2 และ 3 ตัวสถิติทดสอบ M มีอำนาจการทดสอบสูงสุด รองลงมาคือตัวสถิติทดสอบ GB และ TMB ตามลำดับ ข) กรณีที่ความผิดพลาดมีการแจกแจงแบบเบ้ยวา ในงานวิจัยครั้งนี้ใช้การแจกแจงแบบคอกนอร์มอล แกมมา และไวบูลล์ โดยทั่วไปของทุกการแจกแจงแบบเบียวาที่ศึกษาว่าตัวสถิติทดสอบ M และ GB สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกัน ส่วนตัวสถิติทดสอบ TMB ควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้น้อยที่สุด ผลการเปรียบเทียบค่าอำนาจการทดสอบพบว่าให้ผลเหมือนกับกรณี ข้อ ก) ปัจจัยที่มีอิทธิพลต่ออำนาจการทดสอบจากมากไปน้อย คือ ค่าเปรอ์เซนต์การปลอมปน (p) ค่าความแปรปรวน (62) และค่า shape parameter ตามลำดับ

Share

COinS