Chulalongkorn University Theses and Dissertations (Chula ETD)
Other Title (Parallel Title in Other Language of ETD)
A task-oriented dialogue bot using long short-term memory with attention for Thai language
Year (A.D.)
2019
Document Type
Thesis
First Advisor
บุญเสริม กิจศิริกุล
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Department (if any)
Department of Computer Engineering (ภาควิชาวิศวกรรมคอมพิวเตอร์)
Degree Name
วิทยาศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิทยาศาสตร์คอมพิวเตอร์
DOI
10.58837/CHULA.THE.2019.1137
Abstract
หุ่นยนต์สนทนาที่มุ่งงานสามารถช่วยบรรลุเป้าหมายที่เฉพาะเจาะจงให้กับผู้ใช้งานได้ เช่น การจองร้านอาหาร เป็นต้น การเรียนรู้ของเครื่องด้วยวิธีกำหนดกฎสำหรับสถานการณ์ต่าง ๆ ทำให้บทสนทนาระหว่างผู้ใช้งานกับหุ่นยนต์ขาดความยืดหยุ่นและมีต้นทุนสูงเมื่อต้องการปรับเปลี่ยนกฎ ที่ผ่านมาหุ่นยนต์สนทนาที่ใช้เทคนิคกำหนดกฎนั้น ไม่สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ จึงเริ่มใช้วิธีการทางปัญญาประดิษฐ์ซึ่งทำให้สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ นอกจากนี้วิธีการนี้ยังช่วยให้ผู้ใช้งานสามารถสนทนากับหุ่นยนต์ได้ยืดหยุ่นมากขึ้น ซึ่งหุ่นยนต์สนทนาที่ถูกพัฒนาด้วยวิธีนี้ส่วนมากจะใช้คำฝังตัวเป็นตัวแทนข้อความซึ่งถูกพัฒนาโดย Mikolov และคณะ [10] นอกจากนี้มีหลายงานวิจัยที่พยายามสร้างหุ่นยนต์สนทนาที่มุ่งเน้นงานแบบครบวงจรซึ่งสามารถเพิ่มประสิทธิภาพให้กับหุ่นยนต์ได้ ตัวอย่างสถาปัตยกรรมแบบครบวงจร ได้แก่ แบบจำลอง Hybrid Code Networks (HCNs) [8] ซึ่งใช้หน่วยความจำระยะสั้นแบบยาว [23] โดยใช้ชุดข้อมูลบทสนทนาการจองร้านอาหารเพื่อวัดประสิทธิภาพของแบบจำลองในการติดตามสถานะบทสนทนาสนทนาและทำนายการตอบโต้ของหุ่นยนต์ ในวิทยานิพนธ์ฉบับนี้ได้เสนอแบบจำลองที่ใช้หน่วยความจำระยะสั้นแบบยาวโดยเพิ่มกลไกจุดสนใจสำหรับการจองร้านอาหาร อย่างไรก็ตามเพื่อให้บทสนทนาจองร้านอาหารมีความซับซ้อนและสมจริงมากขึ้น จึงได้สร้างชุดข้อมูลการจองร้านอาหารที่สอดคล้องกับวัฒนธรรมไทยเพื่อทดลองว่าแบบจำลองจะทำงานอย่างไรในสภาพแวดล้อมที่สมจริงยิ่งขึ้น ซึ่งผลการทดลองแสดงให้เห็นว่าแบบจำลองที่นำเสนอนั้นมีประสิทธิภาพในการบรรลุเป้าหมายที่ต้องการ
Other Abstract (Other language abstract of ETD)
A task-oriented dialogue bot helps users achieve a predefined goal within a closed domain such as finding a restaurant and making a reservation. The defining rules for various scenarios not only cost to maintain as the number of rules grows larger but also limit the number of conversations between the bot and users. Instead of responding to user inputs with no quantifiable objective like traditional rule-based approach, a dialogue bot with the neural-based approach attempts to track the user intention in each action. Moreover, this approach also has a more flexible conversational flow. Many dialogue bots based on the Artificial Intelligence approach have been developed by learning word representations such as word embedding developed by Mikolov et al. [10] and accomplished outstanding improvements. Besides, there are attempts to build an end-to-end task-oriented dialogue bot, which can reach promising performance comparing to a hand-crafted baseline [17]. One such end-to-end architecture is the Hybrid Code Networks (HCNs) [8] using the simulated conversation of human-bot in the domain of restaurant booking translated into Thai language to train an LSTM [23] to track dialogue states and predict the next bot response. This research proposes a similar architecture to HCNs with the addition of attention to LSTM. However, for a real-world use-case, we build the new restaurant reservation dataset in order to meet the Thai culture to see how a model would perform in a more realistic environment. Experimental results show that our proposed method is effective in achieving the desired goals.
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
รอบโลก, รมณ, "หุ่นยนต์สนทนาที่มุ่งงานโดยใช้หน่วยความจำระยะสั้นแบบยาวกับกลไกจุดสนใจสำหรับภาษาไทย" (2019). Chulalongkorn University Theses and Dissertations (Chula ETD). 9513.
https://digital.car.chula.ac.th/chulaetd/9513