Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

A task-oriented dialogue bot using long short-term memory with attention for Thai language

Year (A.D.)

2019

Document Type

Thesis

First Advisor

บุญเสริม กิจศิริกุล

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Department (if any)

Department of Computer Engineering (ภาควิชาวิศวกรรมคอมพิวเตอร์)

Degree Name

วิทยาศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิทยาศาสตร์คอมพิวเตอร์

DOI

10.58837/CHULA.THE.2019.1137

Abstract

หุ่นยนต์สนทนาที่มุ่งงานสามารถช่วยบรรลุเป้าหมายที่เฉพาะเจาะจงให้กับผู้ใช้งานได้ เช่น การจองร้านอาหาร เป็นต้น การเรียนรู้ของเครื่องด้วยวิธีกำหนดกฎสำหรับสถานการณ์ต่าง ๆ ทำให้บทสนทนาระหว่างผู้ใช้งานกับหุ่นยนต์ขาดความยืดหยุ่นและมีต้นทุนสูงเมื่อต้องการปรับเปลี่ยนกฎ ที่ผ่านมาหุ่นยนต์สนทนาที่ใช้เทคนิคกำหนดกฎนั้น ไม่สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ จึงเริ่มใช้วิธีการทางปัญญาประดิษฐ์ซึ่งทำให้สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ นอกจากนี้วิธีการนี้ยังช่วยให้ผู้ใช้งานสามารถสนทนากับหุ่นยนต์ได้ยืดหยุ่นมากขึ้น ซึ่งหุ่นยนต์สนทนาที่ถูกพัฒนาด้วยวิธีนี้ส่วนมากจะใช้คำฝังตัวเป็นตัวแทนข้อความซึ่งถูกพัฒนาโดย Mikolov และคณะ [10] นอกจากนี้มีหลายงานวิจัยที่พยายามสร้างหุ่นยนต์สนทนาที่มุ่งเน้นงานแบบครบวงจรซึ่งสามารถเพิ่มประสิทธิภาพให้กับหุ่นยนต์ได้ ตัวอย่างสถาปัตยกรรมแบบครบวงจร ได้แก่ แบบจำลอง Hybrid Code Networks (HCNs) [8] ซึ่งใช้หน่วยความจำระยะสั้นแบบยาว [23] โดยใช้ชุดข้อมูลบทสนทนาการจองร้านอาหารเพื่อวัดประสิทธิภาพของแบบจำลองในการติดตามสถานะบทสนทนาสนทนาและทำนายการตอบโต้ของหุ่นยนต์ ในวิทยานิพนธ์ฉบับนี้ได้เสนอแบบจำลองที่ใช้หน่วยความจำระยะสั้นแบบยาวโดยเพิ่มกลไกจุดสนใจสำหรับการจองร้านอาหาร อย่างไรก็ตามเพื่อให้บทสนทนาจองร้านอาหารมีความซับซ้อนและสมจริงมากขึ้น จึงได้สร้างชุดข้อมูลการจองร้านอาหารที่สอดคล้องกับวัฒนธรรมไทยเพื่อทดลองว่าแบบจำลองจะทำงานอย่างไรในสภาพแวดล้อมที่สมจริงยิ่งขึ้น ซึ่งผลการทดลองแสดงให้เห็นว่าแบบจำลองที่นำเสนอนั้นมีประสิทธิภาพในการบรรลุเป้าหมายที่ต้องการ

Other Abstract (Other language abstract of ETD)

A task-oriented dialogue bot helps users achieve a predefined goal within a closed domain such as finding a restaurant and making a reservation. The defining rules for various scenarios not only cost to maintain as the number of rules grows larger but also limit the number of conversations between the bot and users. Instead of responding to user inputs with no quantifiable objective like traditional rule-based approach, a dialogue bot with the neural-based approach attempts to track the user intention in each action. Moreover, this approach also has a more flexible conversational flow. Many dialogue bots based on the Artificial Intelligence approach have been developed by learning word representations such as word embedding developed by Mikolov et al. [10] and accomplished outstanding improvements. Besides, there are attempts to build an end-to-end task-oriented dialogue bot, which can reach promising performance comparing to a hand-crafted baseline [17]. One such end-to-end architecture is the Hybrid Code Networks (HCNs) [8] using the simulated conversation of human-bot in the domain of restaurant booking translated into Thai language to train an LSTM [23] to track dialogue states and predict the next bot response. This research proposes a similar architecture to HCNs with the addition of attention to LSTM. However, for a real-world use-case, we build the new restaurant reservation dataset in order to meet the Thai culture to see how a model would perform in a more realistic environment. Experimental results show that our proposed method is effective in achieving the desired goals.

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.