Chulalongkorn University Theses and Dissertations (Chula ETD)

Other Title (Parallel Title in Other Language of ETD)

การทำนายอากาศยานที่เดินทางถึงล่าช้ากว่ากำหนดด้วยวิธีการเรียนรู้ของเครื่อง

Year (A.D.)

2023

Document Type

Thesis

First Advisor

Nantachai Kantanantha

Faculty/College

Faculty of Engineering (คณะวิศวกรรมศาสตร์)

Department (if any)

Department of Industrial Engineering (ภาควิชาวิศวกรรมอุตสาหการ)

Degree Name

Master of Engineering

Degree Level

Master's Degree

Degree Discipline

Industrial Engineering

DOI

10.58837/CHULA.THE.2023.113

Abstract

Flight delays pose a significant challenge to the growth and efficiency of the US airline industry, which is a central focus of our thesis that extends to the broader global airline sector. This study aims to predict aircraft arrival delays utilizing machine learning models. In addressing the substantial challenge of aircraft delays within the US airline industry, our research relied on Kaggle datasets. Following comprehensive data reorganization and cleanup processes, a crucial aspect of our approach involved integrating weather data from the arrival airport at the time of arrival into the model, thereby enhancing our dataset to bolster predictive accuracy. The thesis explores the efficacy of four prominent machine learning methodologies—Random Forest, CatBoost, Gradient Boosting, and AdaBoost—utilizing robust GridSearchCV to rigorously test numerous hyperparameter combinations. The outcomes underscored the Random Forest model's prowess, showcasing an impressive 83% accuracy and an F1-score of 0.56, emerging as the most promising method. While Gradient Boosting, CatBoost, and AdaBoost achieved accuracies of 81.1%, 81%, and 72.6% respectively, the highest F1-score of 0.56 was attained by the Random Forest method, followed by Gradient Boosting (0.47), CatBoost (0.46), and AdaBoost (0.45). However, limitations in accessing in-flight traffic data, enroute weather at different flight levels, and aircraft-specific details underscore the necessity for enhanced data acquisition strategies to fortify real-time aircraft arrival predictions and further refine predictive models. As aircraft delays, primarily influenced by air traffic and weather, continue to present challenges, specialized forecasting models and the integration of advanced technologies become imperative for improving air travel efficiency

Other Abstract (Other language abstract of ETD)

ความล่าช้าของเที่ยวบินนับเป็นความท้าทายที่สำคัญต่อการเติบโตและประสิทธิภาพของอุตสาหกรรมการบินของสหรัฐอเมริกา ซึ่งเป็นจุดสนใจหลักของวิทยานิพนธ์ที่สะท้อนให้เห็นถึงภาคสายการบินทั่วโลก การศึกษานี้มีวัตถุประสงค์เพื่อคาดการณ์ความล่าช้าในการมาถึงของเครื่องบินโดยใช้แบบจำลองการเรียนรู้ของเครื่อง เพื่อจัดการกับความล่าช้าของเครื่องบินซึ่งเป็นความท้าทายที่สำคัญสำหรับอุตสาหกรรมการบินของสหรัฐอเมริกา การวิจัยอาศัยชุดข้อมูลจาก Kaggle โดยนำมาทำการจัดระเบียบข้อมูลใหม่ให้มีความครอบคลุม วิทยานิพนธ์นี้มีการนำเอามุมมองที่สำคัญเกี่ยวกับการรวบรวมข้อมูลสภาพอากาศจากสนามบินปลายทาง ณ เวลาที่เครื่องบินจะมาถึงเข้าไปในแบบจำลอง ดังนั้นการปรับปรุงชุดข้อมูลของวิทยานิพนธ์นี้จะพัฒนาความแม่นยำในการทำนายของเครื่องมากขึ้น วิทยานิพนธ์นี้กำหนดตัวชี้วัดประสิทธิภาพของวิธีการเรียนรู้ของเครื่องทั้งหมดสี่วิธี ได้แก่ Random Forest, CatBoost, Gradient Boosting และ AdaBoost โดยทำการใช้ GridSearchCV ที่นำไฮเปอร์พารามิเตอร์ทุกแบบมาทดสอบอย่างครบถ้วน ผลลัพธ์ที่ได้ตอกย้ำถึงความแม่นยำของแบบจำลอง Random Forest โดยแสดงความแม่นยำที่น่าประทับใจถึง 83% และ F1-score ที่ 0.56 ซึ่งถือเป็นวิธีการที่มีความแม่นยำมากที่สุด ในขณะที่ Gradient Boosting, CatBoost และ AdaBoost มีความแม่นยำ 81.1%, 81% และ 72.6% ตามลำดับ ค่า F1-score สูงสุดที่ 0.56 ซึ่งได้มาจากวิธี Random Forest ตามมาด้วย Gradient Boosting (0.47), CatBoost (0.46) และ AdaBoost (0.45) อย่างไรก็ตาม ข้อจำกัดในการเข้าถึงข้อมูลการจราจรบนเที่ยวบิน สภาพอากาศระหว่างเส้นทางในระดับความสูงของเที่ยวบินที่แตกต่างกัน และรายละเอียดเฉพาะของเครื่องบินนั้นๆ เน้นย้ำถึงความจำเป็นในการปรับปรุงกลยุทธ์การรับข้อมูล เพื่อเพิ่มประสิทธิภาพของการคาดการณ์การมาถึงของเครื่องบินแบบเรียลไทม์ และปรับแต่งแบบจำลองการคาดการณ์เพิ่มเติม เนื่องจากความล่าช้าของเครื่องบินซึ่งส่วนใหญ่ส่งผลมาจากการจราจรทางอากาศและสภาพอากาศนั้น ยังคงเป็นความท้าทายที่สำคัญในปัจจุบัน ดังนั้นแบบจำลองการพยากรณ์เฉพาะทางและการบูรณาการเทคโนโลยีขั้นสูงจึงมีความจำเป็นที่จะนำมาใช้ในการปรับปรุงประสิทธิภาพของการเดินทางทางอากาศ

Share

COinS
 
 

To view the content in your browser, please download Adobe Reader or, alternately,
you may Download the file to your hard drive.

NOTE: The latest versions of Adobe Reader do not support viewing PDF files within Firefox on Mac OS and if you are using a modern (Intel) Mac, there is no official plugin for viewing PDF files within the browser window.