Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

A comparison of speech discrimination assessment methods based on event-related potential (ERP)

Year (A.D.)

2021

Document Type

Thesis

First Advisor

เศรษฐา ปานงาม

Second Advisor

พศิน อิศรเสนา ณ อยุธยา

Third Advisor

โสฬพัทธ์ เหมรัญช์โรจน์

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Degree Name

วิศวกรรมศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิศวกรรมชีวเวช

DOI

10.58837/CHULA.THE.2021.958

Abstract

การจำแนกเสียงพูดคือความสามารถในการจำแนกระหว่างเสียงพยางค์หรือคำ คนที่มีความสามารถในการจำแนกเสียงพูดต่ำมักจะมีปัญหาในการแยกระหว่างคำที่มีเสียงคล้ายกัน โดยปกติการจำแนกเสียงพูดถูกประเมินโดยนักโสตสัมผัสวิทยาทำให้เข้าถึงการประเมินได้ยากเนื่องจากมีนักโสตสัมผัสวิทยาจำนวนไม่มาก นอกจากนี้การประเมินอาจใช้เวลานานหรือไม่สะดวกสำหรับผู้ป่วยบางกลุ่ม เพื่อลดปัญหาเหล่านี้จึงมีการพัฒนาวิธีประเมินการจำแนกเสียงพูดโดยใช้ศักย์ไฟฟ้าสมองสัมพันธ์กับเหตุการณ์ (Event-Related Potentials) วิธีหนึ่งที่มีการใช้คือการสังเกตองค์ประกอบ Mismatch Negativity (MMN) ระหว่างทำการทดลองการฟังแบบ Oddball ต่อมามีการเสนอวิธีใหม่โดยนำสิ่งกระตุ้นทางสายตาที่เป็นตัวอักษรมาใช้ร่วมกับสิ่งกระตุ้นทางเสียง งานวิจัยนี้เสนอวิธีการประเมินโดยใช้ภาพที่แสดงถึงความหมายของคำโดยแบ่งออกเป็นสามแบบที่มีจำนวนภาพและลำดับในการทดลองแตกต่างกัน วิธีใช้ภาพความหมายของคำแต่ละแบบรวมทั้งวิธีที่ใช้การฟังแบบ Oddball และวิธีที่ใช้ตัวอักษรถูกนำมาทดสอบโดยใช้คำสองคำที่มีเสียงพยัญชนะต่างกันแต่มีเสียงสระและเสียงวรรณยุกต์เหมือนกันเพื่อเปรียบเทียบระหว่างแต่ละวิธีโดยนำรูปคลื่นที่ได้มาสร้างเป็นชุดคุณลักษณะแล้วใช้เทคนิคการเรียนรู้ของเครื่อง (Machine Learning) เพื่อจำแนกระหว่างแต่ละเงื่อนไขในการทดลองซึ่งตัวจำแนกที่ใช้ได้แก่ Linear Discriminant Analysis (LDA) และ Support Vector Machine (SVM) จากการเปรียบเทียบพบว่ามีวิธีที่สามารถนำมาใช้สองวิธี ได้แก่วิธีใช้ภาพความหมายของคำแบบภาพเดียวและวิธีไม่ใช้ภาพ ทั้งสองวิธีนี้ให้ความแม่นยำในการจำแนกสูงกว่า 80% และใช้เวลาหรือสมาธิในการทดลองน้อยกว่าวิธีอื่น การประเมินการจำแนกเสียงพูดโดยใช้วิธีเหล่านี้สามารถนำไปใช้เป็นเครื่องมือคัดกรองอัตโนมัติที่ช่วยประเมินและแนะนำว่าผู้ป่วยควรจะถูกส่งต่อเพื่อตรวจยืนยันกับนักโสตสัมผัสวิทยาหรือไม่ซึ่งสามารถช่วยลดภาระงานของนักโสตสัมผัสวิทยาและทำให้การประเมินเข้าถึงได้ง่ายขึ้น

Other Abstract (Other language abstract of ETD)

Speech discrimination is a hearing ability related to differentiating between similar sounding words. Usually, speech discrimination assessment requires appointments with an audiologist. This can be time-consuming and inaccessible to most patients due to the shortage of audiologists. To mitigate these problems, Event-Related Potentials (ERP) were used to develop different methods to assess speech discrimination. One approach is to observe the Mismatch Negativity (MMN) component during an auditory oddball task. Another approach used visual stimuli depicting letters in addition to auditory stimuli. In this work we propose a method using pictures representing word meaning. We implemented our picture-based method with three strategies differing in number of pictures and test sequences. We compared them to the original visual method and auditory method. We found two promising methods: picture-based method with single picture and auditory method. Both methods achieved over 80% accuracy when using machine learning algorithms to classify between conditions. They also required less time or effort than other methods. These ERP-based methods have the potential to be used as an automatic assessment system which acts as a pre-screening tool and recommend whether a patient should see an audiologist.

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.