Chulalongkorn University Theses and Dissertations (Chula ETD)
การค้นหาเพลงโดยการร้องทำนองอย่างแม่นยำ โดยใช้การปรับขนาดเอกรูป ไดนามิกไทม์วอร์ปปิง และฟังก์ชันขอบเขตล่าง
Other Title (Parallel Title in Other Language of ETD)
Accurate music search by humming using uniform scaling, dynamic time warping, and lower bounding function
Year (A.D.)
2007
Document Type
Thesis
First Advisor
โชติรัตน์ รัตนามหัทธนะ
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
วิศวกรรมศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิศวกรรมคอมพิวเตอร์
DOI
10.58837/CHULA.THE.2007.1363
Abstract
ระบบค้นหาเพลงโดยการร้องทำนองเป็นระบบที่อนุญาตให้ผู้ใช้สามารถค้นหาเพลงจากการร้องทำนองหรือการร้องเพลงในบางส่วนของเพลงที่ต้องการ อย่างไรก็ตามวิธีที่น่าจะ สามารถนำมาประยุกต์ใช้กับระบบค้นหาเพลงโดยการร้องทำนองได้อย่างเหมาะสมมากที่สุดในปัจจุบัน ก็คือ วิธีปรับขนาดกับไทม์วอร์ปปิง ซึ่งเป็นวิธีที่ผสานการปรับขนาดเอกรูปและไดนามิกไทม์วอร์ปปิงเข้าไว้ด้วยกัน อย่างไรก็ตามวิธีดังกล่าวก็ยังไม่สามารถที่จะค้นหาเพลงภายใต้ฐานข้อมูลขนาดใหญ่ได้อย่างแม่นยำ ทั้ง ๆ ที่วิธีดังกล่าวดูเหมือนว่าจะสามารถรองรับความแปรผันต่าง ๆ ของผู้ใช้ได้อย่างครบถ้วนไม่ว่าจะเป็นการร้องทำนองที่มีจังหวะช้าหรือเร็ว รวมทั้งการร้องทำนองที่มีจังหวะไม่คงที่ แต่การละเลยถึงความสำคัญในการแปลงข้อมูลให้เป็นบรรทัดฐาน ทำให้การเปรียบเทียบข้อมูลระหว่างเสียงร้องทำนองและเพลงจึงไม่สามารถทำได้อย่างแม่นยำ ดังนั้น เพื่อที่จะสามารถค้นหาเพลงจากเสียงร้องทำนองได้อย่างแม่นยำ งานวิจัยนี้จึงเสนอวิธีปรับขนาดเอกรูปและไดนามิกไทม์วอร์ปปิงที่รองรับการแปลงข้อมูลให้เป็นบรรทัดฐาน รวมไปถึงฟังก์ชันขอบเขตล่างของวิธีดังกล่าว เพื่อที่จะสามารถค้นหาเพลงได้อย่างมีประสิทธิภาพ ยิ่งไปกว่านั้น งานวิจัยนี้ยังได้ประยุกต์ใช้วิธีการค้นหาข้อมูลที่มีประสิทธิภาพกับวิธีที่นำเสนอ เพื่อที่จะเพิ่มความเร็วในการค้นหาข้อมูล สุดท้าย จากการทดลองในงานวิจัยนี้ ซึ่งใช้แฟ้มข้อมูลเสียงร้องทำนองจำนวน 100 แฟ้ม ที่ได้จากกลุ่มตัวอย่างจำนวน 15 คน ทั้งเพศชายและเพศหญิง ภายใต้ฐานข้อมูลขนาด 1,000 เพลง ความแม่นยำในการค้นหาเพลงจากเสียงร้องทำนองของวิธีที่นำเสนอเท่ากับ 77 เปอร์เซ็นต์ ด้วยระยะเวลาในการค้นหาเพลงเฉลี่ยต่ำกว่า 10 วินาที ซึ่งวิธีที่นำเสนอนั้นสามารถค้นหาข้อมูลได้อย่างถูกต้องแม่นยำกว่าวิธีอื่น ๆ ที่ได้มีการทดลองมาทั้งหมด รวมไปถึงวิธีปรับขนาดกับไทม์วอร์ปปิง
Other Abstract (Other language abstract of ETD)
Query-by-humming system is a system that allows users to conveniently search for the music by just humming or singing some parts of the music. The most promising method for the query-by-humming system, Scaled and Warped Matching or SWM, which is a combination of Uniform Scaling and Dynamic Time Warping, still cannot accurately search for the music from very large databases, although SWM appears to deal with almost all users’ variations properly such as singing or humming in faster, slower or inconsistence tempos. The rationale behind this inaccuracy is its failure to realize the importance of normalization in SWM. Thus, to achieve accurate music search by humming, this research proposes Uniform Scaling and Dynamic Time Warping under normalization transformation, including its lower bounding function in order to efficiently search for the music. Moreover, this research also applies an efficient search algorithm to the proposed method so as to speed up the calculation. Finally, according to the experiments in this research, which use 100 sung queries collected from 15 subjects of both genders under 1,000 songs, the accuracy of the proposed method is 77 percent with an average searching time below 10 seconds, giving significant improvement over all rival methods, including SWM.
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
เอื้อจงประสิทธิ์, ไวยณ์วุฒิ, "การค้นหาเพลงโดยการร้องทำนองอย่างแม่นยำ โดยใช้การปรับขนาดเอกรูป ไดนามิกไทม์วอร์ปปิง และฟังก์ชันขอบเขตล่าง" (2007). Chulalongkorn University Theses and Dissertations (Chula ETD). 66852.
https://digital.car.chula.ac.th/chulaetd/66852