Chulalongkorn University Theses and Dissertations (Chula ETD)
Year (A.D.)
2022
Document Type
Thesis
First Advisor
Boonserm Kijsirikul
Second Advisor
Yuji Iwahori
Faculty/College
Faculty of Engineering (คณะวิศวกรรมศาสตร์)
Department (if any)
Department of Computer Engineering (ภาควิชาวิศวกรรมคอมพิวเตอร์)
Degree Name
Master of Engineering
Degree Level
Master's Degree
Degree Discipline
Computer Engineering
DOI
10.58837/CHULA.THE.2022.86
Abstract
Automatic lymph node (LN) segmentation and detection for cancer staging are critical. In clinical practice, computed tomography (CT) and positron emission tomography (PET) imaging detect abnormal LNs. Despite its low contrast and variety in nodal size and form, LN segmentation remains a challenging task. Deep convolutional neural networks frequently segment items in medical photographs. Most state-of-the-art techniques destroy image's resolution through pooling and convolution. As a result, the models provide unsatisfactory results. Keeping the issues in mind, a well-established deep learning technique UNet++ was modified using bilinear interpolation and total generalized variation (TGV) based upsampling strategy to segment and detect mediastinal lymph nodes. The modified UNet++ maintains texture discontinuities, selects noisy areas, searches appropriate balance points through backpropagation, and recreates image resolution. Collecting CT image data from TCIA, 5-patients, and ELCAP public dataset, a dataset was prepared with the help of experienced medical experts. The UNet++ was trained using those datasets, and three different data combinations were utilized for testing. Utilizing the proposed approach, the model achieved 94.8% accuracy, 91.9% Jaccard, 94.1% recall, and 93.1% precision on COMBO_3. The performance was measured on different datasets and compared with state-of-the-art approaches. The UNet++ model with hybridized strategy performed better than others.
Other Abstract (Other language abstract of ETD)
การแบ่งกลุ่มและตรวจจับต่อมน้ำเหลืองสำหรับการระบุระยะของโรคมะเร็งแบบอัตโนมัติเป็นเรื่องที่ซับซ้อน ในทางการแพทย์ (ในระยะที่ต้องเฝ้าระวังผู้ป่วย) การถ่ายภาพรังสีโดยใช้คอมพิวเตอร์ (CT) และการถ่ายภาพรังสีด้วยการปล่อยโพซิตรอน (PET) สามารถใช้ในการระบุต่อมน้ำเหลืองที่มีลักษณะผิดปกติได้ ถึงอย่างไรก็ตาม วิธีการดังกล่าวก็มีข้อจำกัดในเรื่องของการจำแนกความแตกต่างและความหลากหลายในเชิงขนาดและรูปร่างของต่อมน้ำเหลือง การแบ่งกลุ่มต่อมน้ำเหลืองยังคงเป็นงานที่ท้าทาย วิธีการเรียนรู้แบบอัตโนมัติด้วยการเลียนแบบการทำงานของโครงข่ายประสาทของมนุษย์ (Deep Convolutional Neural Network) จึงมักเป็นวิธีที่ถูกใช้ในการแบ่งกลุ่มสิ่งต่างๆ บนภาพฉายสำหรับทางการแพทย์ เทคนิคที่ทันสมัยต่างๆ จึงมักทำลายความละเอียดของภาพฉายผ่านเทคนิคการกรองข้อมูลของรูปภาพ เช่น การทำ Image Pooling และ Image Convolution ด้วยเหตุนี้เอง รูปแบบที่ถูกสร้างขึ้นเหล่านั้น จึงมักให้ผลลัพธ์ที่ไม่น่าพึงพอใจ เมื่อคิดถึงปัญหาเหล่านี้ต่อไป เทคนิค UNet++ ที่เป็นเทคนิคการเรียนรู้ขั้นสูงที่เป็นที่รู้จักกันอย่างแพร่หลาย จึงถูกปรับปรุงโดยการนำเทคนิคการสุ่มระดับสีจากรูปภาพเดิมอย่างเทคนิค Bilinear Interpolation พร้อมทั้งกลยุทธการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรต่างๆ อย่างกลยุทธ Total Generalized Variation-based Upsampling มาใช้ในการแบ่งกลุ่มและตรวจจับกลุ่มต่อมน้ำเหลืองบริเวณทรวงอกด้านหน้า (Mediastinal Lymph Nodes) เทคนิค Unet++ ที่ถูกปรับปรุงนี้ยังคงให้สัมผัสถึงความที่ไม่ต่อเนื่อง เลือกใช้บริเวณที่มีจุดรบกวนในภาพ และค้นหาจุดสมดุลที่เหมาะสมผ่านเทคนิคการทำโครงข่ายประสาทเทียมแบบย้อนกลับ (Backpropagation) และสร้างความละเอียดของภาพขึ้นมาใหม่ งานวิจัยนี้ได้รวบรวมข้อมูลภาพฉายรังสีจาก TCIA จากกลุ่มผู้ป่วย 5 รายและใช้ชุดข้อมูลสาธารณะอย่าง ELCAP ซึ่งเป็นชุดข้อมูลที่ถูกจัดเตรียมขึ้นโดยผู้เชี่ยวชาญทางการแพทย์หลากหลายท่าน และใช้ข้อมูลเหล่านี้เป็นพื้นฐานในการวิเคราะห์และประมวลผลด้วยเทคนิค UNet++ การผสมผสานข้อมูลที่แตกต่างกันถึง 3 แบบถูกใช้เพื่อทดสอบ ผลปรากฎว่า รูปแบบที่ได้จากเทคนิคดังกล่าว ให้ผลลัพธ์ที่มีความแม่นยำถึง 94.8% และได้ดัชนี Jaccard 91.9% อีกทั้งยังมีอัตราการเรียกคืนข้อมูล (Recall) สูงถึง 94.1% และมีค่า Precision สูงถึง 93.1% จากข้อมูลทั้ง 3 ชุด สมรรถภาพของมันถูกวัดด้วยชุดข้อมูลที่แตกต่างกันถึง 3 ชุดข้อมูล รวมถึงยังมีการเปรียบเทียบสมรรถนะของมันกับเทคนิคทันสมัยอื่นๆ อีกด้วย และผลปรากฎว่า รูปแบบที่ได้จาก Unet++ ที่ผสมผสานการใช้กลยุทธต่างๆ ที่กล่าวมาข้างต้นนั้น ทำงานได้ดีกว่ารูปแบบที่ได้จากเทคนิคอื่นๆ
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-No Derivative Works 4.0 International License.
Recommended Citation
Nayan, Al-Akhir, "Mediastinal Lymph Node Detection and Segmentation using Deep Learning" (2022). Chulalongkorn University Theses and Dissertations (Chula ETD). 5797.
https://digital.car.chula.ac.th/chulaetd/5797