ผลการเปรียบเทียบประสิทธิภาพของอัลกอริทึมการเรียนรู้ของเครื่องสำหรับการพยากรณ์ผลผลิตกล้วยไม้ในประเทศไทย
The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand
คำสำคัญ:
การเรียนรู้ของเครื่อง, กล้วยไม้, การถดถอยอย่างง่าย, เกรเดียนท์บูตทรีส์, แรนดอมฟอเรสท์บทคัดย่อ
บทความนี้มีวัตถุประสงค์ เพื่อประยุกต์การเรียนรู้ของเครื่องในการพยากรณ์ผลผลิตกล้วยไม้ในประเทศไทย ในการศึกษาครั้งนี้ใช้กระบวนการวิเคราะห์ข้อมูลมาตรฐาน เรียกว่า Cross-industry standard process (CRISP) ประกอบด้วย 6 ขั้นตอน ได้แก่ เข้าใจปัญหาของธุรกิจ เข้าใจข้อมูล เตรียมข้อมูล พัฒนาแบบจำลอง การประเมิน และการนำไปใช้จริง ข้อมูลที่ใช้รวบรวมข้อมูลพื้นที่เพาะปลูก จำนวนครัวเรือน และผลผลิตกล้วยไม้จาก www.oae.go.th และ www.ditp.go.th ในปี 2559 - 2563 จำนวน 20 จังหวัด การเตรียมและคัดเลือกข้อมูลให้สมบูรณ์เหมาะสำหรับการทำเหมืองข้อมูลด้วยกระบวนการ Extract transform load (ETL) จากนั้นทำการโอนย้ายข้อมูล การลดขนาดของข้อมูล และการทำความสะอาดข้อมูล ใช้โปรแกรม Knime เป็นเครื่องมือ วิเคราะห์หาความสัมพันธ์ และใช้อัลกอริทึมพยากรณ์ผลผลิตกล้วยไม้ด้วย 3 แบบ ได้แก่ Simple regression tree, Gradient boosted trees และ Random forest การทดสอบประสิทธิภาพอัลกอริทึมด้วยการหา R2 เพื่อหาอัลกอริทึมที่เหมาะสมที่สุดและวัดผล ซึ่งผลการศึกษา พบว่า การพยากรณ์ผลผลิตกล้วยไม้ในประเทศไทยจากอัลกอริทึม Gradient boosted tree มีค่าถูกต้องสูงสุด คิดเป็นร้อยละ 97.50 เมื่อเทียบกับอัลกอริทึม Simple regression tree และ Random forest ถูกต้องร้อยละ 96.40 และ 92.80 ตามลำดับ สามารถนำมาแสดงผลข้อมูลด้วยภาพโดยใช้ Power business intelligence (Power BI) ซึ่งเป็นประโยชน์ในการวางแผนการผลิต เพื่อเพิ่มยอดขายได้เป็นอย่างดี
Downloads
References
จิรนันท์ เอี่ยมศริยารักษ์. สถานการณ์และการพยากรณ์ปริมาณผลผลิตปริมาณส่งออก และราคาส่งออกของกล้วยไม้ตัดดอกของประเทศไทย. กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร์; 2551.
Shearer C. The CRISP-DM model: the new blueprint for data mining. J Data Warehous 2000;5:13-22.
เอกสิทธิ์ พัชรวงศ์ศักดา. การวิเคราะห์ข้อมูลด้วยเทคนิคดาต้าไมน์นิงเบื้องต้น. พิมพ์ครั้งที่ 2. กรุงเทพฯ: เอเชีย ดิจิตอลการพิมพ์ จำกัด; 2557.
Smriti S. What is mean squared error, mean absolute error, root mean squared error and r squared? [Internet]. 2019 [cited 2021 August 4]. Available from: https://www.studytonight.com/post/what-is-mean-squared-error-mean-absolute-error-root-mean-quared-error-and-rsquared
นฤพนต์ ว่องประชานุกูล. วิธีที่เหมาะสมสำหรับการตัดกิ่งต้นไม้ตัดสินใจของการทำเหมืองข้อมูลทางด้านวิทยาศาสตร์ [วิทยานิพนธ์ปริญญาวิศวกรรมศาสตรมหาบัณฑิต]. นครราชสีมา: มหาวิทยาลัยเทคโนโลยีสุรนารี; 2548.
Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd ed. Hoboken: Wiley; 2013.
Downloads
เผยแพร่แล้ว
How to Cite
ฉบับ
บท
License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.