Chulalongkorn University Theses and Dissertations (Chula ETD)
Median-difference window subseries score for contextual anomaly on time series
Other Title (Parallel Title in Other Language of ETD)
ค่าคะแนนความแตกต่างมัธยฐานของหน้าต่างอนุกรมย่อยสำหรับค่าผิดปกติแบบบริบทบนอนุกรมเวลา
Year (A.D.)
2016
Document Type
Thesis
First Advisor
Krung Sinapiromsaran
Faculty/College
Faculty of Science (คณะวิทยาศาสตร์)
Degree Name
Master of Science
Degree Level
Master's Degree
Degree Discipline
Applied Mathematics and Computational Science
DOI
10.58837/CHULA.THE.2016.1298
Abstract
Anomaly detection on time series is one of the exciting topics in data mining. The aim is to find a data point which is different from the majority, called an anomaly. In this thesis, a novel anomaly score called Median-Difference Window subseries Score (MDWS) is proposed with its algorithm together with the parameter of the recommended window length for detecting the contextual anomalies on time series data. It is computed as the subtraction of the middle-window point with the median of all data points within the current window. The proposed MDWS algorithm is implemented as the median-update of the current window subseries to maintain the linear time complexity. Two anomaly thresholds are applied from interquartile range rule. The experimental results show that the MDWS has the highest performance on both synthetic and real world benchmark datasets from Yahoo! and Numenta comparing with others existing anomaly detection methods. Moreover, MDWS algorithm is also faster than other algorithm on the large dataset.
Other Abstract (Other language abstract of ETD)
การตรวจจับค่าผิดปกติบนอนุกรมเวลาเป็นหนึ่งในหัวข้อที่น่าสนใจในการทำเหมืองข้อมูล โดยมีจุดประสงค์เพื่อค้นหาค่าข้อมูลซึ่งมีความแตกต่างจากข้อมูลส่วนใหญ่เรียกว่าค่าผิดปกติ ในวิทยานิพนธ์ฉบับนี้ คะแนนค่าผิดปกติแบบใหม่เรียกว่า ค่าคะแนนความแตกต่างมัธยฐานของหน้าต่างอนุกรมย่อย (เอ็มดีดับเบิลยูเอส) ถูกนำเสนอกับขั้นตอนวิธี พร้อมกับพารามิเตอร์ของความยาวหน้าต่างแนะนำ เพื่อตรวจจับค่าผิดปกติแบบบริบทบนอนุกรมเวลา การคำนวณทำได้โดยการลบกันของ ค่ากลาง-หน้าต่างกับค่ามัธยฐานของทุกค่าข้อมูลในหน้าต่างปัจจุบัน ขั้นตอนวิธีเอ็มดีดับเบิลยูเอสที่นำเสนอใช้การปรับมัธยฐานของหน้าต่างอนุกรมย่อย ณ ขณะนั้นเพื่อคงความซับซ้อนของเวลาเชิงเส้น สองเกณฑ์ค่าผิดปกติถูกประยุกต์มาจากกฎพิสัยระหว่างควอร์ไทล์ ผลการทดลองแสดงให้เห็นว่าเอ็มดีดับเบิลยูเอสมีประสิทธิภาพที่สุดทั้งบนชุดข้อมูลเกณฑ์มาตรฐานสังเคราะห์และชุดข้อมูลเกณฑ์มาตรฐานโลกจริงจากยะฮู้ (Yahoo) และนูเมนต้า (Numenta) เปรียบเทียบกับวิธีตรวจจับค่าผิดปกติอื่นๆที่มีอยู่ นอกจากนั้น ขั้นตอนวิธีเอ็มดีดับเบิลยูเอสยังคงมีความเร็วกว่าขั้นตอนวิธีอื่นอย่างมากบนชุดข้อมูลขนาดใหญ่
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
Sagoolmuang, Artit, "Median-difference window subseries score for contextual anomaly on time series" (2016). Chulalongkorn University Theses and Dissertations (Chula ETD). 62987.
https://digital.car.chula.ac.th/chulaetd/62987