Chulalongkorn University Theses and Dissertations (Chula ETD)

การออกแบบและพัฒนาโปรแกรมการแบ่งส่วนในหน้าเอกสารสำหรับการรู้จำอักษร

Other Title (Parallel Title in Other Language of ETD)

Design and development of a page segmentation program for character recognition

Year (A.D.)

2002

Document Type

Thesis

First Advisor

บุญเสริม กิจศิริกุล

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Degree Name

วิทยาศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิทยาศาสตร์คอมพิวเตอร์

DOI

10.58837/CHULA.THE.2002.1246

Abstract

วิทยานิพนธ์ฉบับนี้มีวัตถุประสงค์ เพื่อออกแบบและพัฒนาโปรแกรมการแบ่งส่วนในหน้าเอกสารสำหรับการรู้จำตัวอักษร เพื่อจำแนกประเภทของข้อมูลที่เป็นตัวอักษร ตาราง และรูปภาพ ออกจากกัน โดยใช้วิธีการแบ่งส่วนแบบล่างขึ้นบน และวิธีการจำแนกประเภทข้อมูลแบบเชิงสถิติ ข้อมูลภาพเอกสารที่ใช้ทดสอบ ประกอบด้วยเอกสาร 50 หน้า โปรแกรมเริ่มต้นอ่านข้อมูลทั้งหน้าเอกสาร เพื่อคำนวณหาขอบเขตของข้อมูลที่อยู่ใกล้กันรวมกันให้เป็นข้อมูลบล็อกเดียว กัน จากนั้นขอบเขตของบล็อกข้อมูลทั้งหมดจะนำมาเป็นข้อมูลเข้าสำหรับการวิเคราะห์ เพื่อจำแนกประเภทของข้อมูลที่อยู่ภายในขอบเขตนั้นตามวิธีการเชิงสถิติ ผลจากการทดลอง โปรแกรมสามารถจำแนกประเภทข้อมูล ซึ่งประกอบด้วยบล็อกของข้อมูลเป็นตัวอักษรจำนวน 7,319 บล็อก บล็อกของตารางจำนวน 22 บล็อก และบล็อกของรูปภาพจำนวน 213 บล็อก แยกความผิดพลาดเป็นภาพของตัวอักษรเฉลี่ย 1.29 เปอร์เซ็นต์ ตารางเฉลี่ย 2 เปอร์เซ็นต์ และรูปภาพเฉลี่ย 18.06 เปอร์เซ็นต์

Other Abstract (Other language abstract of ETD)

The objective of this thesis is to design and develop a program for page segmentation of document images to classify data to characters, tables, and pictures using a bottom-up method and statistical rules. The program is tested on 50 pages of document images. The program starts by reading a whole page of a document to calculate the nearest bounding box including all bounding boxes. This data is used for classification by statistical rules. From the experimental results, the program can classify data into 7,319 blocks of characters, 22 blocks of tables and 213 blocks of images. The error rates are 1.29%, 2%, 18.06% for characters, tables and pictures, respectively.

Share

COinS