Chulalongkorn University Theses and Dissertations (Chula ETD)
การหาแผ่นแบบเฉลี่ยสำหรับการจำแนกประเภทข้อมูลอนุกรมเวลาที่รวดเร็วและแม่นยำ
Other Title (Parallel Title in Other Language of ETD)
Fast and accurate template averaging for time series classification
Year (A.D.)
2015
Document Type
Thesis
First Advisor
โชติรัตน์ รัตนามหัทธนะ
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
วิศวกรรมศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิศวกรรมคอมพิวเตอร์
DOI
10.58837/CHULA.THE.2015.1301
Abstract
ข้อมูลอนุกรมเวลาเป็นข้อมูลที่น่าสนใจในการทำเหมืองข้อมูลอันเนื่องจากข้อมูลมีลำดับอย่างชัดเจนในตัวเอง การจำแนกประเภทข้อมูลอนุกรมเวลาเป็นวิธีการหนึ่งของการทำเหมืองข้อมูลอนุกรมเวลาที่ใช้อย่างแพร่หลายในหลากหลายสาขาวิชา เช่น สาขาการแพทย์ สาขาการเงิน หรือด้านอุตสาหกรรม งานวิจัยมากมายจึงได้เกิดขึ้นเพื่อพัฒนาการจำแนกประเภทข้อมูลอนุกรมเวลาให้มีความถูกต้องแม่นยำมากยิ่งขึ้น วิธีการหนึ่งที่ได้รับความนิยมและสามารถจำแนกประเภทได้ความแม่นยำสูงคือ การจำแนกประเภทข้อมูลแบบเพื่อนบ้านใกล้สุดลำดับที่ 1 โดยใช้การวัดระยะทางแบบไดนามิกไทม์วอร์ปปิง วิธีการนี้เป็นการเปรียบเทียบระยะทางข้อมูลเรียนรู้กับข้อมูลสอบถาม เพื่อกำหนดคลาสให้กับข้อมูลสอบถาม อย่างไรก็ตามการคำนวณระยะทางแบบไดนามิกไทม์วอร์ปปิงใช้เวลาสูงดังนั้นหากข้อมูลมีจำนวนมากจะทำให้เกิดข้อจำกัดในการทำงาน จากข้อจำกัดที่เกิดขึ้นทำให้มีงานวิจัยเกี่ยวกับการลดเวลาที่ใช้ในการคำนวณโดยลดจำนวนข้อมูลเรียนรู้ที่ใช้ในการวิเคราะห์ลง วิธีหนึ่งที่น่าสนใจคือการสร้างแผ่นแบบเฉลี่ยขึ้นเพื่อเป็นตัวแทนข้อมูลเรียนรู้ ส่งผลให้ลดข้อมูลเรียนรู้ที่ใช้ในการวิเคราะห์ลงได้มาก อย่างไรก็ตามแผ่นแบบเฉลี่ยเพียงแผ่นแบบเดียวต่อคลาสไม่เพียงพอต่อการได้ความแม่นยำสูง จึงมีงานวิจัยที่ใช้การจัดกลุ่มข้อมูลเข้ามาช่วยในการแยกข้อมูลในคลาสออกเป็นกลุ่มย่อยแล้วทำการสร้างแผ่นแบบหลายแผ่นแบบต่อหนึ่งคลาส แต่ทว่าการจัดกลุ่มข้อมูลเพื่อแยกข้อมูลออกเป็นกลุ่มย่อยนั้นมีความยากในการปรับค่าตัวแปรให้เหมาะสม และใช้เวลาในการจัดกลุ่มสูงเพื่อให้ได้ความแม่นยำที่สูง งานวิจัยนี้จึงมีแนวคิดที่จะนำเสนอวิธีการสร้างแผ่นแบบเฉลี่ยที่ปรับปรุงการจัดกลุ่มข้อมูลนั้นให้เหลือเพียงค่าตัวแปรเดียวที่ปรับได้ง่ายและใช้เวลาในการจัดกลุ่มน้อยลง ซึ่งจากผลการทดลองวิธีการที่นำเสนอสามารถลดเวลาที่ใช้ในการจัดกลุ่มข้อมูลก่อนสร้างแผ่นแบบลงได้มากเปรียบเทียบกับวิธีการล่าสุดในปัจจุบัน และยังคงความแม่นยำในการจำแนกประเภทข้อมูลไว้ได้
Other Abstract (Other language abstract of ETD)
Time series data is an interested data for data mining fields because the data have specific order within itself. Time series data classification is one of the data mining techniques that is used in many domains such as medical, financial, and industrial. Therefore, many researches have been focused on improving accuracy for time series data classification. One of the popular and accurate methods of time series data classification is one-nearest neighbor classification using Dynamic Time Warping (DTW) as a distance measure. This method calculates a distance between training data and testing data with an objective to assign class to unknown instances in the test data. However, Dynamic Time Warping distance measure requires large computation time, becoming a limitation for large datasets. Hence, many researches have attempted to reduce computation time by reducing the size of the training dataset. One of the methods is to build an average template to represent each class of the training data, so that it can reduce the number of training data for classification. Nevertheless, one template per class is insufficient to achieve high accuracy. As a remedy, some researches have attempted to use clustering techniques to split the data and build multiple templates per class. However, those algorithms still suffer from many predefined and hard-to-set parameters, while some require high computation time for high accuracy results. Therefore, this thesis work proposed a faster template averaging method that improves the data splitting process, and has only one easy-to-set parameter. From the experiments, the proposed method can reduce computation time in building templates compared to the state-of-the-art method and still have high accuracy.
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
เสถียรวิริยคุณ, พงศกร, "การหาแผ่นแบบเฉลี่ยสำหรับการจำแนกประเภทข้อมูลอนุกรมเวลาที่รวดเร็วและแม่นยำ" (2015). Chulalongkorn University Theses and Dissertations (Chula ETD). 70385.
https://digital.car.chula.ac.th/chulaetd/70385