Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

ภาพความละเอียดสูงยิ่งยวดด้วยการใช้กลไกความสนใจสำหรับข้อความในฉาก

Year (A.D.)

2024

Document Type

Thesis

First Advisor

Supavadee Aramvith

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Department (if any)

Department of Electrical Engineering (ภาควิชาวิศวกรรมไฟฟ้า)

Degree Name

Master of Engineering

Degree Level

Master's Degree

Degree Discipline

Electrical Engineering

DOI

10.58837/CHULA.THE.2024.1365

Abstract

Scene Text Image Super-Resolution (STISR) is crucial in enhancing text recognition for low-resolution images, often degraded due to environmental and device limitations. While many existing STISR approaches leverage super-resolution techniques to refine image quality, they frequently need specialized mechanisms to extract text-specific features. Most existing methods were based on feature extraction methods that missed critical details, such as edges and text-background contrasts, that are usually important for recognition. In this work, we propose a new feature extraction method that uses Channel Attention and Spatial Attention mechanisms to emphasize features related to text, namely edges, contours, and spatial alignment. We add a new guidance branch to conduct the super-resolution process more effectively, using advanced text-specific clues from the pre-trained text recognizer. This text guidance includes the context that enhances feature extraction; it focuses the model on the critical regions while suppressing the interference of irrelevant backgrounds. Our model is trained and evaluated on the TextZoom dataset - a benchmark specially designed for scene text super-resolution, which includes low-resolution and high-resolution paired text images taken in various real-world conditions. These results show that our approach allows for substantial text recognition accuracy, significantly improving readability at different levels of image degradation. This result underlines the potential of our method in practical applications of STISR, where clarity and recognition reliability are essential.

Other Abstract (Other language abstract of ETD)

ภาพความละเอียดสูงยิ่งยวดสำหรับข้อความในฉาก (Scene Text Image Super-Resolution: STISR) มีความสำคัญอย่างยิ่งในการปรับปรุงการรู้จำข้อความสำหรับภาพที่มีความละเอียดต่ำ ซึ่งมักจะลดคุณภาพลงเนื่องจากข้อจำกัดด้านสภาพแวดล้อมและอุปกรณ์ แม้ว่าวิธีการ STISR ที่มีอยู่จำนวนมากจะใช้เทคนิคการเพิ่มความละเอียดเพื่อปรับปรุงคุณภาพของภาพ แต่ก็มักจะต้องใช้กลไกเฉพาะทางเพื่อดึงคุณสมบัติเฉพาะของข้อความ วิธีการที่มีอยู่ส่วนใหญ่ใช้วิธีการดึงคุณสมบัติที่พลาดรายละเอียดที่สำคัญ เช่น ขอบและความเปรียบต่างระหว่างข้อความกับพื้นหลัง ซึ่งมักมีความสำคัญต่อการรู้จำ ในงานวิจัยนี้ เราเสนอวิธีการสกัดลักษณะเด่นใหม่ที่ใช้กลไกความสนใจด้านช่องสัญญาณและกลไกความสนใจด้านพื้นที่ เพื่อเน้นลักษณะเด่นที่เกี่ยวข้องกับข้อความ ได้แก่ ขอบ เส้นขอบนอก และการจัดวางในพื้นที่ เราเพิ่มส่วนการแนะนำใหม่เพื่อดำเนินกระบวนการเพิ่มความละเอียดให้มีประสิทธิภาพมากขึ้น โดยใช้ข้อมูลเฉพาะของข้อความขั้นสูงจากตัวรู้จำข้อความที่ผ่านการฝึกฝนมาก่อน การแนะนำข้อความนี้รวมถึงบริบทที่ช่วยเพิ่มประสิทธิภาพการสกัดลักษณะเด่น ซึ่งทำให้แบบจำลองมุ่งเน้นไปที่บริเวณสำคัญในขณะที่ลดการรบกวนจากพื้นหลังที่ไม่เกี่ยวข้อง แบบจำลองของเราได้รับการฝึกฝนและประเมินผลบนชุดข้อมูล TextZoom ซึ่งเป็นเกณฑ์มาตรฐานที่ออกแบบมาเป็นพิเศษสำหรับการเพิ่มความละเอียดภาพข้อความในฉาก ซึ่งรวมถึงภาพข้อความคู่ที่มีความละเอียดต่ำและความละเอียดสูงที่ถ่ายในสภาพแวดล้อมจริงที่หลากหลาย ผลลัพธ์เหล่านี้แสดงให้เห็นว่าวิธีการของเราช่วยให้มีความแม่นยำในการรู้จำข้อความได้มากขึ้นอย่างมาก ช่วยปรับปรุงความสามารถในการอ่านในระดับต่างๆ ของการลดคุณภาพของภาพ ผลลัพธ์นี้เน้นย้ำถึงศักยภาพของวิธีการของเราในการใช้งานจริงของ STISR ซึ่งความชัดเจนและความน่าเชื่อถือในการรู้จำเป็นสิ่งสำคัญ

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.