Chulalongkorn University Theses and Dissertations (Chula ETD)

การประยุกต์นิวรอลเน็ตเวิร์กหลายโครงข่ายบนข้อมูลขนาดใหญ่

Other Title (Parallel Title in Other Language of ETD)

Applying multiple neural networks on large scale data

Year (A.D.)

2011

Document Type

Thesis

First Advisor

สุกรี สินธุภิญโญ

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Degree Name

วิทยาศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

วิทยาศาสตร์คอมพิวเตอร์

DOI

10.58837/CHULA.THE.2011.1391

Abstract

การเรียนรู้และวิเคราะห์ข้อมูลขนาดใหญ่ด้วยนิวรอลเน็ตเวิร์ก เป็นเรื่องที่สำคัญมากในการทำเหมืองข้อมูล แต่ก็มักจะเกิดปัญหาในด้านเวลาที่ใช้ในการเรียนรู้ ในงานวิจัยนี้ได้เสนอวิธีการเรียนรู้โดยการใช้นิวรอลเน็ตเวิร์กหลายโครงข่าย ทำการเรียนรู้บนชุดข้อมูลตัวอย่าง ที่ถูกแบ่งย่อยและสุ่มเลือกมาจากชุดตัวอย่างทั้งหมด จากนั้นจึงทำการรวมโหนดในชั้นแฝงจากเน็ตเวิร์กแต่ละอัน เพื่อหาค่าน้ำหนักประจำโหนดในชั้นแฝงใหม่ที่เหมาะสมสำหรับข้อมูลทั้งชุด ผู้วิจัยได้ทำการพัฒนาอัลกอริทึมการรวมโหนด โดยประยุกต์จากการหาระยะยุคลิดเพื่อระบุความใกล้เคียงกันของโหนด เพื่อที่จะรวมค่าน้ำหนักของโหนดที่ใกล้เคียงเข้าไว้ด้วยกัน ผลการทดลองพบว่า วิธีการที่นำเสนอสามารถลดเวลาในการเรียนรู้ลงได้อย่างมาก และยังคงรักษาเปอร์เซ็นต์ความถูกต้องได้เหมือนกับการใช้เซตตัวอย่างทั้งหมด

Other Abstract (Other language abstract of ETD)

Learning and analysis on large scale data sets is very important in data mining. Large amount of data can be a cause of problem in learning time and also in learning capability. This research proposed a novel method to solve that problem by using multiple neural networks to learn from multiple sub datasets that extracted equally from the whole dataset. We employ algorithm by applying Euclidean Distance to integrate weight of hidden nodes from each network.The experimental results show that reducing the learning time for the proposed method and also preserve the accuracy.

Share

COinS