Chulalongkorn University Theses and Dissertations (Chula ETD)
การแยกส่วนภาพวัตถุสำหรับการเข้ารหัสสัญญาณวิดีโอ บนพื้นฐานของคอนเทนต์ตามข้อกำหนดของ MPEG-4
Other Title (Parallel Title in Other Language of ETD)
Object segmentation for content based video coding according to MPEG-4
Year (A.D.)
2000
Document Type
Thesis
First Advisor
สมชาย จิตะพันธ์กุล
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
วิศวกรรมศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิศวกรรมไฟฟ้า
DOI
10.58837/CHULA.THE.2000.1178
Abstract
นำเสนอกรรมวิธีการแยกส่วนภาพวัตถุของสัญญาณวิดีโอตามข้อกำหนดของ MPEG-4 (Moving Picture Expert Group-4) ซึ่งได้กำหนดมาตรฐานการเข้ารหัสสัญญาณวิดีโอ บนพื้นฐานของหน่วนวัตถุ กรรมวิธีการแยกส่วนภาพวัตถุนี้ อยู่บนพื้นฐานของการรวมกันของคุณลักษณะหลายอย่าง ประกอบด้วยข้อมูลเชิงพื้นที่และข้อมูลเชิงเวลา การแยกส่วนภาพเชิงพื้นที่ประกอบด้วยขั้นตอน การสร้างความเรียบง่ายให้กับภาพ การตรวจรู้ขอบเขตบริเวณ และการกำหนดบริเวณให้แก่จุดภาพโดยกรรมวิธีสันปันน้ำ ตามลำดับ วิทยานิพนธ์ฉบับนี้ได้นำการปฏิบัติการเชิงสัณฐาน แบบเปิด-ปิดมาใช้ในการสร้างความเรียบง่ายให้แก่ภาพ และการประมาณเกรเดียนต์แบบหลายขั้นมาใช้ในการตรวจรู้ขอบเขตของบริเวณ กรรมวิธีที่เสนอนี้สามารถลดจำนวนบริเวณ และจำนวนจุดภาพของขอบเขตที่ไม่ระบุบริเวณ เพื่อลดการใช้ทรัพยากรของการคำนวณในขั้นตอนกรรมวิธีสันปันน้ำ การแยกส่วนเชิงเวลาจะใช้การตรวจรู้การเปลี่ยนแปลง และตัวปฏิบัติการเชิงสัณฐานในการสร้างความราบเรียบ ให้แก่มาสก์ของภาพวัตถุที่เปลี่ยนแปลง และใช้กฎการตัดสินใจในการกำหนดบริเวณ ร่วมกับการใช้หน่วยความจำเก็บผลของภาพวัตถุในเฟมก่อนหน้าเพื่อกำหนดขอบเขตของภาพวัตถุที่ชัดเจน และช่วยในการติดตามการเคลื่อนที่ของวัตถุอย่างแม่นยำ วิธีนี้จะช่วยให้สามารถตรวจรู้วัตถุที่เคลื่อนที่ได้อย่างต่อเนื่อง ผลจากการนำกรรมวิธีการแยกส่วนภาพวัตถุ ที่เสนอขึ้นมาประมวลผลกับลำดับภาพการประชุมทางวิดีโอพบว่า โดยคุณภาพเชิงอัตวิสัย สามารถแยกส่วนภาพวัตถุเคลื่อนที่ ได้ภาพวัตถุที่มีความหมายและมีคุณภาพที่ดีเมื่อเปรียบเทียบกับผลจาก COST 211 (Cooperation Europeenne dans le recherche Scientifique et Technique 211) และโดยคุณภาพเชิงวัตถุจะมีความผิดพลาดของผลการแยกส่วน เมื่อเทียบกับมาสก์ของภาพวัตถุอ้างอิงไม่เกินร้อยละ 15 ของขนาดภาพวัตถุ ขณะที่การตรวจรู้บริเวณของภาพวัตถุเคลื่อนที่ขาดไปไม่เกินร้อยละ 5 ของขนาดภาพวัตถุ ดังนั้นกรรมวิธีนี้จึงให้ภาพวัตถุที่มีความหมาย และมีฟังก์ชันบนพื้นฐานของคอนเทนต์ตามข้อกำหนดของ MPEG-4
Other Abstract (Other language abstract of ETD)
To propose a video object segmentation algorithm according to the MPEG-4 which provides the object based video coding standard. This algorithm is based on the combination of multiple features including spatial and temporal informations. The spatial segmentation includes image simplification, boundary detection and region assignment by the watershed algorithm. The morphological opening and closing are used in image simplification process, subsequently, the multiscale gradient approximation is used in boundary detection. The proposed algorithm can reduce the number of regions and uncertain pixels in order to reduce the computational load in the watershed process. By the way, the temporal segmentation using change detection and morphological operator can create the change mask. In addition, the decision process and the memory of the previous segmentation result are used to determine object boundary and detect object tracking. Exploiting the proposed algorithm to segment the moving object in the video conferencing sequence, the subjective test showed meaningful and good quality video objects compared with those of COST211 results. Moreover, the objective test showed an error of segmentation result when compared with reference mask, which is less than 15% of the object size, while the miss of moving object is less than 5% of the object size. Therefore, this algorithm can provide the semantic meaningful video objects and preserve the content based functionalities according to MPEG-4.
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
ตันเจริญ, ดัชกรณ์, "การแยกส่วนภาพวัตถุสำหรับการเข้ารหัสสัญญาณวิดีโอ บนพื้นฐานของคอนเทนต์ตามข้อกำหนดของ MPEG-4" (2000). Chulalongkorn University Theses and Dissertations (Chula ETD). 63850.
https://digital.car.chula.ac.th/chulaetd/63850