The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand
The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand
Keywords:
Machine learning, Orchid, Simple regression tree, Gradient boosted trees, Random forestAbstract
This article aims to apply machine learning for predicting the orchid product in Thailand. The technique in this study was the cross-industry standard process (CRISP). There were 6 processes that were business understanding, data understanding, data preparation, model development, evaluation, and deployment. The data of planted were househole and product’s orchid collected from www.oae.go.th and www.ditp.go.th during 2016 till September 2020 that consisted of 20 provinces. To do the data preparation, feature selection for data mining i.e., data transfer, data reduction, data cleaning using Knime a tool. There were 3 algorithms for forecasting orchid product that were simple regression trees, gradient boosted tree and random forest. Algorithm performance testing by using the R2 for most suitable. The results could demonstrate that the most accuracy algorithm was gradient boosted tree with accuracy 97.50% comparing with simple regression and random forest with accuracy 96.40% and 92.80%, respectively. To do the data visualization using power business intelligence (Power BI) that was very beneficial for planning and leads to higher sales.
Downloads
References
จิรนันท์ เอี่ยมศริยารักษ์. สถานการณ์และการพยากรณ์ปริมาณผลผลิตปริมาณส่งออก และราคาส่งออกของกล้วยไม้ตัดดอกของประเทศไทย. กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร์; 2551.
Shearer C. The CRISP-DM model: the new blueprint for data mining. J Data Warehous 2000;5:13-22.
เอกสิทธิ์ พัชรวงศ์ศักดา. การวิเคราะห์ข้อมูลด้วยเทคนิคดาต้าไมน์นิงเบื้องต้น. พิมพ์ครั้งที่ 2. กรุงเทพฯ: เอเชีย ดิจิตอลการพิมพ์ จำกัด; 2557.
Smriti S. What is mean squared error, mean absolute error, root mean squared error and r squared? [Internet]. 2019 [cited 2021 August 4]. Available from: https://www.studytonight.com/post/what-is-mean-squared-error-mean-absolute-error-root-mean-quared-error-and-rsquared
นฤพนต์ ว่องประชานุกูล. วิธีที่เหมาะสมสำหรับการตัดกิ่งต้นไม้ตัดสินใจของการทำเหมืองข้อมูลทางด้านวิทยาศาสตร์ [วิทยานิพนธ์ปริญญาวิศวกรรมศาสตรมหาบัณฑิต]. นครราชสีมา: มหาวิทยาลัยเทคโนโลยีสุรนารี; 2548.
Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd ed. Hoboken: Wiley; 2013.
Downloads
Published
How to Cite
Issue
Section
License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.