The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand

The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand

Authors

  • Yaowalak Koetpan Faculty of Industrial Technology, Kanchanaburi Rajabhat University, Kanchanaburi
  • Suwannee Adsavakulchai School of Engineering, University of the Thai Chamber of Commerce, Bangkok

Keywords:

Machine learning, Orchid, Simple regression tree, Gradient boosted trees, Random forest

Abstract

          This article aims to apply machine learning for predicting the orchid product in Thailand. The technique in this study was the cross-industry standard process (CRISP). There were 6 processes that were business understanding, data understanding, data preparation, model development, evaluation, and deployment. The data of planted were househole and product’s orchid collected from www.oae.go.th and www.ditp.go.th during 2016 till September 2020 that consisted of 20 provinces. To do the data preparation, feature selection for data mining i.e., data transfer, data reduction, data cleaning using Knime a tool. There were 3 algorithms for forecasting orchid product that were simple regression trees, gradient boosted tree and random forest. Algorithm performance testing by using the R2 for most suitable. The results could demonstrate that the most accuracy algorithm was gradient boosted tree with accuracy 97.50% comparing with simple regression and random forest with accuracy 96.40% and 92.80%, respectively. To do the data visualization using power business intelligence (Power BI) that was very beneficial for planning and leads to higher sales.

Downloads

Download data is not yet available.

References

จิรนันท์ เอี่ยมศริยารักษ์. สถานการณ์และการพยากรณ์ปริมาณผลผลิตปริมาณส่งออก และราคาส่งออกของกล้วยไม้ตัดดอกของประเทศไทย. กรุงเทพฯ: บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร์; 2551.

Shearer C. The CRISP-DM model: the new blueprint for data mining. J Data Warehous 2000;5:13-22.

เอกสิทธิ์ พัชรวงศ์ศักดา. การวิเคราะห์ข้อมูลด้วยเทคนิคดาต้าไมน์นิงเบื้องต้น. พิมพ์ครั้งที่ 2. กรุงเทพฯ: เอเชีย ดิจิตอลการพิมพ์ จำกัด; 2557.

Smriti S. What is mean squared error, mean absolute error, root mean squared error and r squared? [Internet]. 2019 [cited 2021 August 4]. Available from: https://www.studytonight.com/post/what-is-mean-squared-error-mean-absolute-error-root-mean-quared-error-and-rsquared

นฤพนต์ ว่องประชานุกูล. วิธีที่เหมาะสมสำหรับการตัดกิ่งต้นไม้ตัดสินใจของการทำเหมืองข้อมูลทางด้านวิทยาศาสตร์ [วิทยานิพนธ์ปริญญาวิศวกรรมศาสตรมหาบัณฑิต]. นครราชสีมา: มหาวิทยาลัยเทคโนโลยีสุรนารี; 2548.

Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3rd ed. Hoboken: Wiley; 2013.

Downloads

Published

17-05-2022

How to Cite

1.
Koetpan Y, Adsavakulchai S. The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand: The Results of Comparison of the Efficiency of Machine Learning Algorithms for Predicting Orchid Products in Thailand. AdvSciJ [Internet]. 2022 May 17 [cited 2024 Dec. 22];22(1):227-3. Available from: https://li02.tci-thaijo.org/index.php/adscij/article/view/857

Issue

Section

Research Articles