Chulalongkorn University Theses and Dissertations (Chula ETD)

วิธีการเลือกฐานหลักสำหรับเทคนิคการลดมิติ

Other Title (Parallel Title in Other Language of ETD)

An approach to basis selection for dimensional reduction techniques

Year (A.D.)

2009

Document Type

Thesis

First Advisor

บุญเสริม กิจศิริกุล

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Degree Name

วิศวกรรมศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิศวกรรมคอมพิวเตอร์

DOI

10.58837/CHULA.THE.2009.1496

Abstract

การลดมิติถือเป็นงานสำคัญในงานการเรียนรู้ของเครื่องและการรู้จำ เนื่องจากในปัจจุบันนี้เรามีความสามารถในการเก็บข้อมูลทุกๆ คุณลักษณะที่เราพอจะนึกถึงได้ ซึ่งนำไปสู่ข้อมูลขนาดใหญ่ที่มีคุณลักษณะมากเกินกว่าที่จะประมวลผลได้ เทคนิคการลดมิติช่วยลดความซ้ำซ้อน ระหว่างคุณลักษณะและช่วยขจัดความห่างมากในชุดข้อมูล การเลือกฐานหลักถือเป็นปัญหาเปิด ว่าเราจะสามารถลดมิติเพื่อให้ได้เซตย่อยของข้อมูลที่เหมาะที่สุดอย่างอัตโนมัติได้อย่างไร ในงานรู้จำบนชุดข้อมูลรูปภาพนั้น เทคนิคการลดมิติได้รับการพิสูจน์ว่าเป็นตัวประมวลผลก่อนที่สำคัญ เทคนิคแบบสองมิติและสองมิติสองทิศทาง เป็นส่วนขยายของเทคนิคการลดมิติสำหรับชุดข้อมูลรูปภาพโดยเฉพาะ เทคนิคแบบสองมิติและสองมิติสองทิศทางให้ค่าความแม่นที่สูงกว่า และมีปริมาณการคำนวณที่น้อยกว่าเมื่อเทียบกับเทคนิคดังเดิม เราได้โต้แย้งว่ากระบวนการเลือกฐานหลักในเทคนิคแบบสองมิตินัน ไม่เหมาะที่สุดและไม่ชัดเจนในเทคนิคแบบสองมิติสองทิศทาง เราได้นำเสนอเทคนิคตัวกรองแบบคะแนนเพื่อช่วยทำให้การเลือกฐานหลักเหมาะที่สุดโดยการทำให้เป็นบรรทัดฐานและจัดเรียงฐานหลักใหม่ที่ให้ผลเป็นค่าความแม่นที่สูงขึ้นในการจำแนก นอกจากนี้เรายังนำเสนอวิธีการเลือกฐานหลักใหม่ในเทคนิคแบบสองมิติสองทิศทางสองวิธี ได้แก่ วิธีใช้เทคนิคคัดเลือกคุณลักษณะแบบผสมและวิธีอัลกอริทึมเชิงละโมบที่ใช้ควบคู่กับการตัดออก ซึ่งทั้งสองวิธีนี้จะใช้ปริมาณการคำนวณน้อยกว่าวิธีดั้งเดิม ที่ใช้การตรวจสอบไขว้ทั้งหมด อีกทั้งยังให้ค่าความแม่นในการจำแนกสูงกว่าวิธีตัดออกโดยอ้างอิงค่าลักษณะเฉพาะ ที่มักจะติดในหุบเขาของปริภูมิค่าความแม่น เราได้ประยุกต์ใช้แนวคิดกับงานในโลกจริง ได้แก่ งานรู้จำใบหน้าและงานรู้จำลายมือ

Other Abstract (Other language abstract of ETD)

Dimensional reduction is an important task in machine learning and pattern recognition. Nowadays, we have gained an ability to collect every feature in our imaginable aspect which leads to massive data that have too many features to process. Dimensional reduction techniques reduce the redundancy among features and conquer the sparseness of the data set. Basis selection is an open problem of how much we should reduce the dimension to be an optimal dataset automatically. In pattern recognition tasks of image data sets, techniques for dimensional reduction have been proven to be an important preprocessing step. 2D and (2D)2 techniques are the extensions of Dimensional Reduction techniques tailored for image data sets. 2D and (2D)2 techniques provide more classification accuracy with less computational cost compared to original techniques. We argue that the step in basis selection of 2D techniques is not optimal and the method of basis selection is not obvious in (2D)2 techniques. We propose the score-based filter techniques to further optimize the basis selection by performing a normalizing and reordering step which results in higher classification accuracy. Moreover, we also introduce a novel basis selection method in (2D)2 techniques based on a greedy algorithm and score metrics which requires less computational cost compared to cross validation based techniques and provides more classification accuracy than eigenvalue-based cut-off techniques which stuck in the valley of accuracy space. We have applied our proposed method to several real world applications, face recognition and hand written recognition.

Share

COinS