Chulalongkorn University Theses and Dissertations (Chula ETD)
Other Title (Parallel Title in Other Language of ETD)
การปรับปรุงเครือข่ายชนิดกราฟเพื่อทำนายคุณสมบัติของสารประกอบทางโมเลกุล
Year (A.D.)
2022
Document Type
Thesis
First Advisor
Duangdao Wichadakul
Second Advisor
Peerapon Vateekul
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Department (if any)
Department of Computer Engineering (ภาควิชาวิศวกรรมคอมพิวเตอร์)
Degree Name
Master of Engineering
Degree Level
Master's Degree
Degree Discipline
Computer Engineering
DOI
10.58837/CHULA.THE.2022.88
Abstract
During the age of deep learning technologies, which have exhibited significant potential in reducing costs and expediting medical development, predicting molecular properties has become a prevalent task that capitalizes on the capabilities of deep learning. This thesis proposed a multimodal Graph Neural Network (GNN) model that utilizes the topology information obtained from molecular graphs through a baseline GNN, facilitating precise property predictions. The thesis improves the baseline CMPNN model by exploring various methods to address potential missing gaps. These methods include incorporating the multimodal module, such as a Bidirectional LSTM module capable of processing text sequences in SMILES format or a spectral graph convolution module. Moreover, self-attention integration into the CMPNN model was implemented using the alpha coefficient method from GATConv. The experimental results show that the proposed multimodal GNN models performed better than the baseline model for predicting molecular properties in seven out of eight datasets from MoleculeNet, including five classification and three regression tasks. These findings show the potential of this methodology across various domains within the field of chemistry, with particular relevance to drug discovery.
Other Abstract (Other language abstract of ETD)
ในยุคของเทคโนโลยีการเรียนรู้เชิงลึก (deep learning) ที่แสดงให้เห็นถึงศักยภาพที่สำคัญในการลดต้นทุนและส่งเสริมการพัฒนาทางการแพทย์อย่างรวดเร็ว การทำนายคุณสมบัติของโมเลกุลเป็นงานหนึ่งที่ได้รับความนิยมและใช้ประโยชน์จากความสามารถของเทคโนโลยีการเรียนรู้เชิงลึก วิทยานิพนธ์ฉบับนี้นำเสนอแบบจำลองกราฟซึ่งรวมโมดูลที่เรียนรู้ชุดข้อมูลเดียวกันจากหลากหลายรูปแบบ (multimodal Graph Neural Network) และใช้ข้อมูลทอพอโลยีที่ได้รับจากกราฟโมเลกุลผ่านแบบจำลองกราฟที่ใช้เป็นเส้นฐาน วิทยานิพนธ์นี้เพิ่มประสิทธิภาพของแบบจำลอง CMPNN ที่ใช้เป็นเส้นฐาน โดยสำรวจวิธีการต่างๆ ที่ยังไม่ได้นำมาใช้ วิธีการเหล่านี้รวมถึงการรวมโมดูลเข้าด้วยกันกับแบบจำลองกราฟ เช่น โมดูล LSTM สองทิศทาง ที่สามารถประมวลผลลำดับของตัวอักษรในรูปแบบ SMILES หรือโมดูลทำสังวัตนาการของกราฟด้วยสเปกตรัม (spectral graph convolution) นอกจากนี้ยังเพิ่มกลไกการเรียนรู้โดยรวมความใส่ใจด้วยตนเอง (self-attention) เข้าในแบบจำลอง CMPNN โดยใช้วิธีการคำนวณตัวเลขอัลฟา (alpha coefficient method) จาก GATConv ผลการทดลองแบบจำลองกราฟที่นำเสนอซึ่งรวมโมดูลที่เรียนรู้ชุดข้อมูลเดียวกันจากหลากหลายรูปแบบ มีประสิทธิภาพโดยรวมดีกว่าแบบจำลองที่ใช้เป็นเส้นฐานในการทำนายคุณสมบัติโมเลกุล จาก 7 ใน 8 ชุดข้อมูลจากโมเลกุลเน็ท ซึ่งประกอบด้วย 5 ชุดข้อมูลในการจำแนกหมวดหมู่ และสามชุดข้อมูลในการทำนายค่า ผลการวิจัยนี้เปิดโอกาสในด้านต่างๆ ในสาขาเคมี โดยเฉพาะอย่างยิ่งในงานค้นพบยา
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
Punnachaiya, Kamol, "Leverage graph neural network for molecular properties prediction" (2022). Chulalongkorn University Theses and Dissertations (Chula ETD). 5799.
https://digital.car.chula.ac.th/chulaetd/5799