Chulalongkorn University Theses and Dissertations (Chula ETD)
การสังเคราะห์พยางค์เสียงหนักและพยางค์เสียงเบาในภาษาไทย
Other Title (Parallel Title in Other Language of ETD)
Synthesis of stressed and unstressed syllable in Thai language
Year (A.D.)
2002
Document Type
Thesis
First Advisor
เอกชัย ลีลารัศมี
Second Advisor
สุดาพร ลักษณียนาวิน
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
วิศวกรรมศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิศวกรรมไฟฟ้า
DOI
10.58837/CHULA.THE.2002.1416
Abstract
วิทยานิพนธ์นี้นำเสนอวิธีการสังเคราะห์พยางค์เสียงหนักและเบาในภาษาไทย โดยการเปลี่ยนสัทลักษณะได้แก่ ช่วงเวลา ความถี่มูลฐาน และแอมพลิจูดของสัญญาณเสียง ซึ่งจะช่วยให้เสียงสังเคราะห์ฟังเป็นธรรมชาติมากขึ้น การปรับช่วงเวลาและความถี่มูลฐานของสัญญาณเสียงจะใช้วิธีทีดี-โซลา (Time-Domain Pitch-Synchronous Overlap Add : TD-PSOLA) โดยที่การปรับช่วงเวลาจะใช้การเพิ่มหรือลดสัญญาณช่วงสั้นเพื่อให้ได้ระยะเวลาของพยางค์ตามการลงเสียงหนักเบาและโครงสร้างของหน่วยจังหวะ ในการปรับความถี่มูลฐานจะปรับระยะห่างระหว่างยอดพิทช์ระบุตามรูปแบบความถี่มูลฐานในฐานข้อมูลความถี่มูลฐานสำหรับพยางค์เสียงเบาที่ได้สร้างไว้ทั้งหมด 14 รูปแบบตามเสียงวรรณยุกต์และโครงสร้างของพยางค์ สำหรับการปรับขนาดแอมพลิจูดของสัญญาณเสียงปรับได้ โดยคูณสัญญาณเสียงด้วยอ้ตราส่วนแอมพลิจูดระหว่างพยางค์เสียงหนักและพยางค์เสียงเบาที่ได้สร้างไว้เป็นฐานข้อมูลตามเสียงสระทั้งหมด 24 หน่วย การประเมินคุณภาพเสียงที่สังเคราะห์ตามวิธีในวิทยานิพนธ์นี้ทำโดยอาสาสมัครจำนวน 10 คน ได้ค่าเอ็มโอเอส (Most Opinion Score : MOS) สำหรับการปรับลักษณะทางสัทศาสตร์ในระดับคำเท่ากับ 3.67 และในระดับประโยค 3.92
Other Abstract (Other language abstract of ETD)
This thesis presents the stressed and unstressed syllables synthesis method by modifying acoustic characteristics consisting of duration, fundamental frequency and sound amplitude in order to make the synthesized speech sound more naturally. Time Domain Pitch Synchronous Overlapped Add (TD-PSOLA) is used for modifying duration and fundamental frequency. Duration can be expanded or compressed by creating or eliminating short time signals to derive the desired syllable duration which depends on its rhythmic unit structure. Fundamental frequency (FO) of speech can be modified according to 14 patterns of unstressed syllable fundamental frequency, which are classified by syllable tone and syllable structure. This modification is by manipulating of the duration among the consecutive pitch marks. Amplitude modification is performed by multiplying the speech signal by the amplitude ratio between unstressed and stressed syllables, which are separated by syllable vowels into 24 units. The speech quality of this synthesis method was assessed by 10 volunteers. The results of assessments have MOS (Mean Opinion Score) is 3.67 for acoustic modification in word and 3.92 for acoustic modification in sentence.
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
พานสมบัติ, นัฐพล, "การสังเคราะห์พยางค์เสียงหนักและพยางค์เสียงเบาในภาษาไทย" (2002). Chulalongkorn University Theses and Dissertations (Chula ETD). 64643.
https://digital.car.chula.ac.th/chulaetd/64643