Study of Clustering Techniques Using Machine Learning on SET100 Stocks of the Stock Exchange of Thailand

Authors

  • Patchara Noppakunmongkolchai Faculty of Science and Technology, Chiang Mai Rajabhat University
  • Prathana Minsan Faculty of Science and Technology, Chiang Mai Rajabhat University
  • Piyachart Wiangnak Faculty of Science and Technology, Chiang Mai Rajabhat University

DOI:

https://doi.org/10.57260/stc.2025.1042

Keywords:

Clustering, K-Means clustering, Hierarchical clustering, DBSCAN, Fuzzy C-Means, SET100 Data

Abstract

Securities trading is one of the investment channels that can generate substantial returns, but these returns also come with high risks. Therefore, an important responsibility of investors is to diversify risk to reduce potential losses.This article presents a method for clustering stocks in the SET100 of the Stock Exchange of Thailand using Machine Learning. It applies Unsupervised Learning techniques, including K-means, Hierarchical Clustering, DBSCAN, and Fuzzy C-means, which can group securities with similar price movements. The study collected historical data of SET 100 stocks, which consist of 100 common stocks with high market capitalization and consistent liquidity. These stocks are fundamentally strong, with continuous business growth, making them attractive to investors. For the clustering process, the study used two key factors: Dividend Yield and Stock Risk (BETA) over a three-year period, covering 274 stocks. The results from the four clustering methods showed that K-means divided the stocks into three groups: low-risk stocks with low dividends (192 stocks), high-dividend low-risk stocks (4 stocks), and growth stocks with high risk (78 stocks). Hierarchical Clustering also resulted in three groups: low-risk stocks with low dividends (163 stocks), high-dividend low-risk stocks (4 stocks), and growth stocks with high risk (107 stocks). DBSCAN identified two groups: the main cluster (266 stocks) and outlier stocks (8 stocks). Fuzzy C-means classified the stocks into three groups: high-dividend low-risk stocks (89 stocks), stocks with balanced risk and return (138 stocks), and highly volatile stocks (47 stocks).

References

จักรกฤษณ์ มะโหฬาร, สุมาลี นามโชติ และ นฤพล อ่อนวิมล. (2567). ปัจจัยที่มีอิทธิพลต่ออัตราเงินปันผลตอบแทนของบริษัทที่จดทะเบียนในตลาดหลักทรัพย์แห่งประเทศไทยดัชนีSET100. วารสารสุทธิปริทัศน์, 38(1), 83-99. สืบค้นจาก https://so05.tci- thaijo.org/index.php/DPUSuthiparithatJournal/article/article/view /269045/181752

ชลวิช สุธัญญารักษ์. (2560). ความเสี่ยงและอัตราผลตอบแทนของหลักทรัพย์หมวดการท่องเที่ยวและสันทนาการ โดยใช้แบบจำลอง CAPM. วารสารบัณฑิตศึกษา มหาวิทยาลัยราชภัฏวไลยอลงกรณ์ ในพระบรมราชูปถัมภ์, 11(3), 13-23. สืบค้นจาก https://so02.tci-thaijo.org/index.php/JournalGradVRU/article/view/108212

นภสินธุ์ สานติวัตร และ สรศาสตร์ สุขเจริญสิน. (2564). การศึกษาความสัมพันธ์ระหว่างการจ่ายเงินปันผลและการเปลี่ยนแปลงของกำไรในอนาคต. จุฬาลงกรณ์ธุรกิจปริทัศน์, 43(169), 1-21. สืบค้นจาก https://so01.tci-thaijo.org/index.php/CBSReview/article/view/250228

สุภาภรณ์ ทิมสำราญ และ ถวิล นิลใบ. (2564). การพยากรณ์ประสิทธิภาพของหุ้น ในตลาดหลักทรัพย์แห่งประเทศไทย. วารสารรามคำแหง ฉบับบัณฑิตวิทยาลัย, 4(3), 75-87. สืบค้นจาก http://www.rujogs.ru.ac.th/Journals/ClickLink/149

Bezdek, J. C. (1981). Objective function clustering. IEEE Transactions on Pattern Analysis and Machine Intelligence, 3(3), 376–386. Retrieved from https://doi.org/10.1109/TPAMI.1981.4767076

SET. (2567). ข้อมูล SET100 จากตลาดหลักทรัพย์แห่งประเทศไทย. สืบค้นจาก https://shorturl .asia/4Shpr

SET investnow. (2568). อัตราผลตอบแทนจากเงินปันผล. สืบค้นจาก https://www.setinvestnow.com /th/glossary/dividend-yield

Sharpe, W. F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk. The Journal of Finance, 19(3), 425–442. Retrieved from https://doi.org/10.1111/j.1540-6261.1964.tb02865.x

Softnix. (2004). K-means. Retrieved from https://shorturl.asia/cdo3e

Weisstein, E. W. (2002). Euclidean distance. MathWorld – A Wolfram Web Resource. Retrieved from https://mathworld.wolfram.com/EuclideanDistance.html

Zarah, P. (2018). Ability of net income in predicting dividend yield operating cash flow as a moderating variable. Archives of Business Research, 6(1), 226-234. Retrieved from http://dx.doi.org/10.14738/abr.61.4128

Zarah, P. (2019). Empirical evidence of market reactions based on signaling theory in Indonesia stock exchange. Investment Management and Financial Innovations, 16(2), 66-77. http://dx.doi.org/10.21511/imfi.16(2).2019.0

Downloads

Published

2025-06-30

How to Cite

Noppakunmongkolchai, P., Minsan, P., & Wiangnak, P. (2025). Study of Clustering Techniques Using Machine Learning on SET100 Stocks of the Stock Exchange of Thailand . Science and Technology to Community, 3(3), 44–57. https://doi.org/10.57260/stc.2025.1042

Issue

Section

Research Articles