Chulalongkorn University Theses and Dissertations (Chula ETD)
Other Title (Parallel Title in Other Language of ETD)
การประมวลผลภาษาธรรมชาติสำหรับการโฆษณาดิจิทัล
Year (A.D.)
2021
Document Type
Thesis
First Advisor
Dittaya Wanvarie
Faculty/College
Faculty of Science (คณะวิทยาศาสตร์)
Department (if any)
Department of Mathematics and Computer Science (ภาควิชาคณิตศาสตร์และวิทยาการคอมพิวเตอร์)
Degree Name
Doctor of Philosophy
Degree Level
Doctoral Degree
Degree Discipline
Computer Science and Information Technology
DOI
10.58837/CHULA.THE.2021.121
Abstract
Advertising is not only a marketing or sales activity but a particular form of two-way communication. In this thesis, we propose to apply the two main subtasks of natural language processing (NLP), namely natural language understanding (NLU) and natural language generation (NLG), to digital advertising to enhance the effectiveness of advertising. We apply weakly-supervised text classification to rapidly build text classifiers for contextual advertising (Jin et al. 2022). The method requires a handful of labeled keywords instead of a large corpus of labeled documents and can be easily transferred to new domains. We further evaluate the weakly-supervised models using unsupervised error estimation and perform automatic keyword selection (Jin et al., 2021a). Unsupervised error estimation is essential because no labeled development dataset is available in real-world problems where weakly-supervised text classification methods are applied. Finally, we tap on a state-of-the-art sequence-to-sequence Transformer model to generate cohesive and diverse advertising slogans from a short company description (Jin et al., In press). We prevent the model from hallucinating unsupported information using entity masking and generate diverse and catchy slogans using conditional training.
Other Abstract (Other language abstract of ETD)
การโฆษณานั้นไม่ได้เป็นเพียงกิจกรรมการตลาดหรือการขาย แต่เป็นการสื่อสารสองทางรูปแบบหนึ่ง ในวิทยานิพนธ์นี้ ผู้วิจัยนำเสนอการประยุกต์งานการประมวลผลภาษาธรรมชาติ (natural language processing) 2 งาน ได้แก่ การเข้าใจภาษาธรรมชาติ (natural language understanding) และ การสังเคราะห์ภาษาธรรมชาติ (natural language generation) กับงานโฆษณาดิจิทัล เพื่อเพิ่มประสิทธิผลในการโฆษณา ผู้วิจัยประยุกต์ใช้การจำแนกข้อความแบบมีผู้สอนเล็กน้อยเพื่อให้สร้างตัวแบบจำแนกข้อความสำหรับการโฆษณาโดยอิงบริบทได้อย่างรวดเร็ว (Jin et al. 2022) วิธีนี้ต้องใช้การกำกับคำสำคัญเพียงเล็กน้อย แทนที่จะใช้คลังข้อความขนาดใหญ่ที่มีการกำกับชนิดของเอกสาร นอกจากนี้ วิธีนี้ยังสามารถนำปรับไปใช้กับโดเมนใหม่ๆ ได้ง่ายอีกด้วย ผู้วิจัยยังประเมินผลตัวแบบซึ่งมีผู้สอนเล็กน้อยโดยใช้การประมาณค่าผิดพลาดแบบไม่มีผู้สอน และเลือกคำสำคัญแบบอัตโนมัติ (Jin et al. 2021a) การประมาณค่าผิดพลาดแบบไม่มีผู้สอนนั้นจำเป็น เนื่องจากเมื่อใช้วิธีการจำแนกข้อความแบบมีผู้สอนเล็กน้อยในสถานการณ์จริงจะไม่มีชุดข้อมูลที่มีการกำกับผลลัพธ์ ตัวแบบทรานส์ฟอร์เมอร์ (Transformer) เป็นตัวแบบบที่ดีที่สุดในการแปลงข้อความเป็นข้อความ ผู้วิจัยใช้ตัวแบบทรานส์ฟอร์เมอร์ในการสร้างคำโฆษณาที่เกี่ยวข้องและมีความหลากลายจากคำอธิบายสั้นๆ ของบริษัท (Jin et al., In press) ผู้วิจัยป้องกันการใช้ข้อมูลที่ไม่สนับสนุนบริษัทจากโดยการปิดชื่อองค์กรในการฝึกสอน และสร้างคำโฆษณาที่หลากหลาย น่าดึงดูด โดยใช้การฝึกสอนแบบมีเงื่อนไข
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
Jin, Yiping, "Natural language processing for digital advertising" (2021). Chulalongkorn University Theses and Dissertations (Chula ETD). 4663.
https://digital.car.chula.ac.th/chulaetd/4663