Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

Novel artificial intelligence-assisted subgrouping of clinical presentation and integrated multi-omics analyses in identification of biomarker candidates for autism spectrum disorder

Year (A.D.)

2020

Document Type

Thesis

First Advisor

เทวฤทธิ์ สะระชนะ

Faculty/College

Faculty of Allied Health Sciences (คณะสหเวชศาสตร์)

Department (if any)

Department of Clinical Chemistry (ภาควิชาเคมีคลินิก)

Degree Name

วิทยาศาสตรมหาบัณฑิต

Degree Level

ปริญญาโท

Degree Discipline

ชีวเคมีคลินิกและอณูทางการแพทย์

DOI

10.58837/CHULA.THE.2020.684

Abstract

โรคออทิซึมสเปกตรัมเป็นความผิดปกติเกี่ยวกับพัฒนาการในช่วงเริ่มแรกของระบบประสาทและสมองซึ่งมีอาการทางคลินิกที่หลากหลายมาก ปัจจุบันยังไม่มีสารบ่งชี้เพื่อช่วยในการวินิจฉัยและแบ่งผู้ป่วยเป็นกลุ่มย่อย แต่การวินิจฉัยที่รวดเร็วเป็นสิ่งสำคัญที่จะช่วยให้ผู้ป่วยออทิซึมสเปกตรัมสามารถได้รับการเรียนรู้และพัฒนาพฤติกรรมที่จำเป็นในการดำรงชีวิตได้ การวินิจฉัยโรคออทิซึมสเปกตรัมตามมาตรฐานสากลใช้แบบสอบถามที่มีความซับซ้อนและใช้เวลามาก ซึ่งในปัจจุบันมีการนำเอาเทคโนโลยีปัญญาประดิษฐ์มาประยุกต์ใช้ในการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีความซับซ้อน อย่างไรก็ตามการนำเอาปัญญาประดิษฐ์มาใช้วิเคราะห์อาการทางคลินิกของผู้ป่วยออทิซึมสเปกตรัมยังไม่แพร่หลายนัก ในการศึกษานี้ผู้วิจัยต้องการนำเอาปัญญาประดิษฐ์มาใช้แบ่งผู้ป่วยออทิซึมสเปกตรัมจำนวน 85 ราย ออกเป็นกลุ่มย่อยตามอาการทางคลินิกจากข้อมูลแบบทดสอบในการวินิจฉัยผู้ป่วยออทิซึมสเปกตรัม ADI-R จำนวน 123 ข้อ จากนั้นได้ทำการสร้างโมเดลในการจัดกลุ่มและเปรียบเทียบประสิทธิภาพรวมถึงจำนวนข้อคำถามที่ใช้ในแต่ละโมเดล นอกจากนี้ผู้วิจัยได้ศึกษาหาสารบ่งชี้ทางชีวภาพที่เป็นตัวแทนของโรคออทิซึมสเปกตรัมกลุ่มย่อยจากลักษณะอาการทางคลินิกโดยอาศัยการบูรณาการโอมิกส์หลายระดับ จึงได้ดำเนินการวิเคราะห์รูปแบบทรานสคริปโตม และวิเคราะห์รูปแบบโปรตีโอมของผู้ป่วยออทิซึมสเปกตรัมโดยใช้เซลล์เพาะเลี้ยงชนิดลิมโฟบลาสต์เป็นต้นแบบ โดยใช้เทคนิคการแยกโปรตีนด้วยกระแสไฟฟ้า 2 มิติ (2D-GE) จากนั้นจะทำการระบุโปรตีนด้วยเทคนิค LC-MS/MS เพื่อหาโปรตีนที่ถูกรบกวนการทำงานอย่างมีนัยสำคัญ และบูรณาการข้อมูลเพื่อศึกษาความสอดคล้องและสัมพันธ์กันระหว่างการแสดงออกของโปรตีนและยีน และทำการยืนยันระดับการแสดงออกที่ผิดปกติไปของยีนด้วยเทคนิค Real-time qPCR และโปรตีนด้วยเทคนิค Western blot ในการศึกษาครั้งนี้จากผลการวิเคราะห์ข้อมูลลักษณะอาการทางคลินิกของผู้ป่วยออทิซึมสเปกตรัมจากแบบทดสอบ ADI-R 123 ข้อ พบว่าวิธี K-means clustering ที่แบ่งผู้ป่วยออกเป็น 4 กลุ่มย่อยนั้นให้ประสิทธิภาพในการแบ่งดีที่สุด และเมื่อทำการสร้างโมเดลในการจัดกลุ่มผู้ป่วยตามผลการแบ่งกลุ่มดังกล่าว พบว่าอัลกอริทึม Random forest ที่มีจำนวนต้นไม้ 10 ต้น โดยกระบวนการคัดเลือกข้อมูลแบบ Forward selection ให้ผลการทำนายถูกต้องมากที่สุด (100%) โดยใช้ข้อคำถาม ADI-R เพียง 5 ข้อ ในการแบ่งผู้ป่วยออกเป็นกลุ่มย่อย และจากการวิเคราะห์รูปแบบโปรตีโอมจากเซลล์เพาะเลี้ยงชนิดลิมโฟบลาสต์ของผู้ป่วยออทิซึมสเปกตรัมและออทิซึมสเปกตรัมกลุ่มย่อยด้วยเทคนิค 2D-GE ผู้วิจัยได้ทำการคัดเลือกจุดโปรตีนที่มีการแสดงออกผิดปกติอย่างมีนัยสำคัญและมีค่าสัดส่วนความเข้มแตกต่างกันอย่างน้อยสองเท่ามา 19 จุด เพื่อทำการระบุชนิดของโปรตีนด้วยเทคนิค LC-MS/MS โดยพบว่าจากโปรตีนทั้งหมด HNRNPA2B1 มีระดับการแสดงออกเพิ่มขึ้นในผู้ป่วยออทิซึมสเปกตรัมกลุ่มย่อยที่ไม่มีความผิดปกติด้านภาษารุนแรง โดยที่โปรตีน HNRNPA2B1 MDH2 DLD และ MSN มีระดับการแสดงออกลดลงในผู้ป่วยออทิซึมสเปกตรัมกลุ่มย่อยที่มีความผิดปกติด้านภาษารุนแรง ดังนั้นจากการศึกษาวิจัยในครั้งนี้ได้แสดงให้เห็นว่าการใช้เทคโนโลยีปัญญาประดิษฐ์ในการแบ่งผู้ป่วยออทิซึมสเปกตรัมออกเป็นกลุ่มย่อยตามลักษณะอาการทางคลินิกนั้น สามารถลดความหลากหลายตามลักษณะอาการที่แสดงออกของโรคออทิซึมสเปกตรัมในการวิเคราะห์รูปแบบทรานสคริปโตมและโปรตีโอม รวมถึงการค้นหาโปรตีนที่จำเพาะต่อผู้ป่วยออทิซึมสเปกตรัมกลุ่มย่อย ได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งโปรตีนเหล่านี้อาจใช้เป็นโปรตีนบ่งชี้ในการศึกษาเชิงลึกในประชากรผู้ป่วย เพื่อพัฒนาเป็นสารบ่งชีทางชีวภาพ (Biomarker) หรือศึกษากลไกพยาธิสภาพในระดับชีวโมเลกุลของโรคออทิซึมสเปกตรัมได้ต่อไปในอนาคต

Other Abstract (Other language abstract of ETD)

Autism spectrum disorder (ASD) is an early onset neurodevelopmental disorder with a high degree of heterogeneity. Nowadays, there is still no biomarker for the diagnosis and subtyping for ASD, but there is evidence that early diagnosis and treatment are important for helping people with ASD in gaining necessary functions and behaviors in life. Current international standard ASD diagnosis is based on complicated and time-consuming questionnaires. Artificial intelligence (AI) analysis has been utilized to analyze various types of complicated big data. However, the research to demonstrate its applications on analyzing clinical presentations associated with ASD is still limited. In this study, we, therefore, sought to utilize AI tools to subtype 85 ASD individuals into subgroups based on a total of 123 items from ASD-related clinical phenotypic data. After getting ASD subgroups and the lists of subgroup members, the subgrouping models were compared to the effectiveness of different AI analyses. Moreover, we identified biomarker candidates for each ASD clinical subtype by using multi-omics approaches by performed transcriptome and proteome profiling analysis of lymphoblastoid cell lines (LCLs) derived from ASD patients. We conducted the proteomic analysis using 2D gel electrophoresis (2D-GE), followed by mass spectrometry, to identify proteins that are significantly disrupted in each ASD subgroup and then integrated the transcriptome profile and the proteome profiles to determine the correlation and association between the disrupted genes and proteins. Furthermore, we validated the gene expression by real-time qPCR and protein expression by Western blot analysis. Interestingly, we found that ‘K-means clustering’ which divided the ASD patients into 4 subgroups provided the best efficiency. And when we created the model for subtyping based on K-means clustering, the results show that ‘Random forest’ with 10 trees couple with 'forward selection' analyses gave the most accurate prediction result (100%) and using only 5 ADI-R items to divided ASD patients into subgroups. In addition, from the proteome profiling analysis of LCLs in ASD and ASD subgroups using 2D-GE, we selected 19 significant differentially expressed protein spots with at least two different intensity values to identify the protein by LC-MS/MS. Among those was HNRNPA2B1 which was increased in ASD with non-severe language impairments subgroup. While in ASD with severe language impairments subgroup found decreased expression of HNRNPA2B1 MDH2 DLD and MSN. In conclusion, this study suggests that the use of AI tools to subtyping ASD patients based on clinical manifestations could reduce the diversity of ASD symptoms in transcriptome and proteome profiling analysis, as well as more effective investigation of specific proteins in ASD subgroups which would serve as candidate genes or proteins for biomarker development research for ASD subtyping in the future.

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.