Chulalongkorn University Theses and Dissertations (Chula ETD)

ระบบการรับรู้เสียงพูดแบบต่างบุคคล

Other Title (Parallel Title in Other Language of ETD)

Multispeaker recognition system

Year (A.D.)

1990

Document Type

Thesis

First Advisor

วีระ ริ้วพิทักษ์

Faculty/College

Graduate School (บัณฑิตวิทยาลัย)

Degree Name

วิทยาศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิทยาศาสตร์คอมพิวเตอร์

DOI

10.58837/CHULA.THE.1990.603

Abstract

ระบบการรับรู้เสียงพูดที่ทำการวิจัยนี้เป็นแบบคำเดี่ยวต่างบุคคล ซึ่งขั้นตอนในการวิจัยแบ่ง 3 ส่วน คือขั้นตอนแรกจะทำการหาค่าสัมประสิทธิ์ของสัญญาณ และค่าคาบเสียงสูงต่ำของกลุ่มคำ 2 กลุ่ม เพื่อจะนำมาสร้างเป็นแบบอ้างอิงจากผู้พูด 30 คน ขั้นตอนที่สองกลุ่มของแบบอ้างอิงทั้ง 2 กลุ่ม จะถูกนำมาผ่านการคัดเลือกให้ได้คำละ 10 แบบ โดยอาศัยเทคนิคการจัดกลุ่ม และทำการให้เลเบล ขั้นที่สามจะทำการทดสอบโดยอาศัยแบบทดสอบจากผู้พูด 5 คน มาทำการเปรียบเทียบกับแบบอ้างอิง การคำนวณหา ค่าความแตกต่างระหว่างแบบทดสอบกับแบบอ้างอิง ได้ใช้ เทคนิคของไดนามิคโปรแกรมมิ่ง และกฎการตัดสินใจได้อาศัยเทคนิคของ K-Nearest Neighbour (KNN) การกำหนดค่าความแตกต่างที่ยอมรับได้ ถูกนำมาใช้เพื่อปรับปรงอัตราความถูกต้องในการรับรู้ การทำ Post Processing โดยใช้ค่า Zero Crossing เพื่อปรับปรุงอัตราความถูกต้องของการรับรู้ระหว่างคำว่า "ปาก" และ "มาก" ผลการวิจัยจากคำทดสอบกลุ่มแรกไต้อัตราความถูกต้องร้อยละ 85.8 และคำทดสอบกลุ่มที่สอง ได้อัตราความถูกต้องร้อยละ 94.3

Share

COinS