Chulalongkorn University Theses and Dissertations (Chula ETD)
Improvement of feature preservation in high efficiency video coding
Other Title (Parallel Title in Other Language of ETD)
การปรับปรุงของการอนุรักษ์ลักษณะเฉพาะในการเข้ารหัสวีดิทัศน์ประสิทธิภาพสูง
Year (A.D.)
2016
Document Type
Thesis
First Advisor
Supavadee Aramvith
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
Master of Engineering
Degree Level
Master's Degree
Degree Discipline
Electrical Engineering
DOI
10.58837/CHULA.THE.2016.1517
Abstract
Feature information is known as interest points (keypoints) in an image which is very useful information for video analytic functions such as object detection and tracking, video classification, etc. Due to the characteristic of video coding, it is exploited following human vision system where high frequency component could be removed for better compression. Thus, it can affect to the keypoints, which mostly are the edge information. As a result, with less number of keypoints left, this affects the accuracy of video analytics. To solve this problem, this thesis presents an algorithm to preserve feature information of reconstructed video in the high efficiency video coding (HEVC). Scale-Invariant Feature Transform (SIFT) is chosen to extract the keypoints from raw video sequence. We then consider keypoints as an indicator of the importance of the largest coding unit (LCU). Adaptive LCU selection is defined to determine LCU into two different groups, important LCU group (IMLCU) and non-important LCU group (Non-IMLCU). Moreover, two different bit allocations are generated in rate control to each group based on coding mode, Intra or Inter mode, to achieve the target bit rate and also to keep the feature information. The experimental results show that our proposed algorithm can maintain more keypoints compared to HEVC reference software at the same bitrate based on the peak signal-to-noise ratio (PSNR) and SIFT similarity computation.
Other Abstract (Other language abstract of ETD)
ข้อมูลคุณลักษณะที่ได้มาจากจุดสำคัญในภาพ เป็นข้อมูลที่สำคัญสำหรับการนำไปใช้วิเคราะห์วีดิทัศน์ในรูปแบบการใช้งานต่าง ๆ เช่น การนำไปใช้ตรวจจับและติดตามวัตถุ การจำแนกวีดิทัศน์ เป็นต้น เนื่องจากลักษณะของการเข้ารหัสวิดีทัศน์ จะใช้ประโยชน์จากระบบที่เกี่ยวกับการมองเห็นของมนุษย์ ที่ส่วนประกอบความถี่สูงสามารถถูกขจัดออกไปเพื่อทำให้การบีบอัดข้อมูลได้มากขึ้น ดังนั้นจึงมีผลต่อจุดสำคัญในภาพ โดยเฉพาะอย่างยิ่งบริเวณขอบของภาพ หากจำนวนของจุดสำคัญเหลือน้อยเกินไป จะส่งผลต่อความแม่นยำของการวิเคราะห์วีดิทัศน์ เพื่อแก้ปัญหาดังกล่าววิทยานิพน์นี้นำเสนอขั้นตอนวิธีการรักษาข้อมูลคุณลักษณะเฉพาะของการสร้างวีดิทัศน์ในการเข้ารหัสวีดิทัศน์ประสิทธิภาพสูง ในการศึกษานี้เราเลือกใช้ Scale-Invariant feature transform (SIFT) คือ การเลือกจุดสำคัญจากลำดับวิดีทัศน์ดิบ จากนั้นเราจะพิจารณาจุดสำคัญที่บ่งบอกว่าหน่วยการเข้ารหัสแบบใหญ่ที่สุด นั้นมีความสำคัญ ต่อมาจะใช้ตัวปรับการเลือกหน่วยการเข้ารหัสแบบใหญ่ที่สุด โดยกำหนดหน่วยการเข้ารหัสแบบใหญ่ที่สุด ออกเป็นสองกลุ่ม คือ กลุ่มของหน่วยการเข้ารหัสแบบใหญ่ที่สุดที่มีความสำคัญ และ กลุ่มของหน่วยการเข้ารหัสแบบใหญ่ที่สุดที่ไม่มีความสำคัญ นอกเหนือจากนั้นได้นำเสนอจะแบ่งการจัดสรรบิตออกเป็นสองประเภท คือ การควบคุมอัตราในแต่ละกลุ่มภายใต้โหมดการเข้ารหัสแบบอินทราหรืออินเตอร์ ที่รักษาอัตราบิตเป้าหมาย และข้อมูลคุณลักษณะไว้ ผลการทดสอบแสดงให้เห็นว่าขั้นตอนวิธีที่เรานำเสนอสามารถรักษาจุดสำคัญในวีดิทัศน์ได้มากกว่าโปรแกรมการสร้างวีดิทัศน์ในการเข้ารหัสวีดิทัศน์ประสิทธิภาพสูงอ้างอิง ที่อัตราบิตเท่ากันภายใต้การคำนวณแบบอัตราส่วนค่าสัญญาณสูงสุดกับสัญญาณรบกวน และความเหมือนกันของ SIFT
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
Chen, Sovann, "Improvement of feature preservation in high efficiency video coding" (2016). Chulalongkorn University Theses and Dissertations (Chula ETD). 70559.
https://digital.car.chula.ac.th/chulaetd/70559