Chulalongkorn University Theses and Dissertations (Chula ETD)
วิธีการเลือกฐานหลักสำหรับเทคนิคการลดมิติ
Other Title (Parallel Title in Other Language of ETD)
An approach to basis selection for dimensional reduction techniques
Year (A.D.)
2009
Document Type
Thesis
First Advisor
บุญเสริม กิจศิริกุล
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Degree Name
วิศวกรรมศาสตรมหาบัณฑิต
Degree Level
ปริญญาโท
Degree Discipline
วิศวกรรมคอมพิวเตอร์
DOI
10.58837/CHULA.THE.2009.1496
Abstract
การลดมิติถือเป็นงานสำคัญในงานการเรียนรู้ของเครื่องและการรู้จำ เนื่องจากในปัจจุบันนี้เรามีความสามารถในการเก็บข้อมูลทุกๆ คุณลักษณะที่เราพอจะนึกถึงได้ ซึ่งนำไปสู่ข้อมูลขนาดใหญ่ที่มีคุณลักษณะมากเกินกว่าที่จะประมวลผลได้ เทคนิคการลดมิติช่วยลดความซ้ำซ้อน ระหว่างคุณลักษณะและช่วยขจัดความห่างมากในชุดข้อมูล การเลือกฐานหลักถือเป็นปัญหาเปิด ว่าเราจะสามารถลดมิติเพื่อให้ได้เซตย่อยของข้อมูลที่เหมาะที่สุดอย่างอัตโนมัติได้อย่างไร ในงานรู้จำบนชุดข้อมูลรูปภาพนั้น เทคนิคการลดมิติได้รับการพิสูจน์ว่าเป็นตัวประมวลผลก่อนที่สำคัญ เทคนิคแบบสองมิติและสองมิติสองทิศทาง เป็นส่วนขยายของเทคนิคการลดมิติสำหรับชุดข้อมูลรูปภาพโดยเฉพาะ เทคนิคแบบสองมิติและสองมิติสองทิศทางให้ค่าความแม่นที่สูงกว่า และมีปริมาณการคำนวณที่น้อยกว่าเมื่อเทียบกับเทคนิคดังเดิม เราได้โต้แย้งว่ากระบวนการเลือกฐานหลักในเทคนิคแบบสองมิตินัน ไม่เหมาะที่สุดและไม่ชัดเจนในเทคนิคแบบสองมิติสองทิศทาง เราได้นำเสนอเทคนิคตัวกรองแบบคะแนนเพื่อช่วยทำให้การเลือกฐานหลักเหมาะที่สุดโดยการทำให้เป็นบรรทัดฐานและจัดเรียงฐานหลักใหม่ที่ให้ผลเป็นค่าความแม่นที่สูงขึ้นในการจำแนก นอกจากนี้เรายังนำเสนอวิธีการเลือกฐานหลักใหม่ในเทคนิคแบบสองมิติสองทิศทางสองวิธี ได้แก่ วิธีใช้เทคนิคคัดเลือกคุณลักษณะแบบผสมและวิธีอัลกอริทึมเชิงละโมบที่ใช้ควบคู่กับการตัดออก ซึ่งทั้งสองวิธีนี้จะใช้ปริมาณการคำนวณน้อยกว่าวิธีดั้งเดิม ที่ใช้การตรวจสอบไขว้ทั้งหมด อีกทั้งยังให้ค่าความแม่นในการจำแนกสูงกว่าวิธีตัดออกโดยอ้างอิงค่าลักษณะเฉพาะ ที่มักจะติดในหุบเขาของปริภูมิค่าความแม่น เราได้ประยุกต์ใช้แนวคิดกับงานในโลกจริง ได้แก่ งานรู้จำใบหน้าและงานรู้จำลายมือ
Other Abstract (Other language abstract of ETD)
Dimensional reduction is an important task in machine learning and pattern recognition. Nowadays, we have gained an ability to collect every feature in our imaginable aspect which leads to massive data that have too many features to process. Dimensional reduction techniques reduce the redundancy among features and conquer the sparseness of the data set. Basis selection is an open problem of how much we should reduce the dimension to be an optimal dataset automatically. In pattern recognition tasks of image data sets, techniques for dimensional reduction have been proven to be an important preprocessing step. 2D and (2D)2 techniques are the extensions of Dimensional Reduction techniques tailored for image data sets. 2D and (2D)2 techniques provide more classification accuracy with less computational cost compared to original techniques. We argue that the step in basis selection of 2D techniques is not optimal and the method of basis selection is not obvious in (2D)2 techniques. We propose the score-based filter techniques to further optimize the basis selection by performing a normalizing and reordering step which results in higher classification accuracy. Moreover, we also introduce a novel basis selection method in (2D)2 techniques based on a greedy algorithm and score metrics which requires less computational cost compared to cross validation based techniques and provides more classification accuracy than eigenvalue-based cut-off techniques which stuck in the valley of accuracy space. We have applied our proposed method to several real world applications, face recognition and hand written recognition.
Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
วิริยธรรมภูมิ, พีรธรรม, "วิธีการเลือกฐานหลักสำหรับเทคนิคการลดมิติ" (2009). Chulalongkorn University Theses and Dissertations (Chula ETD). 67715.
https://digital.car.chula.ac.th/chulaetd/67715