การใช้กราฟความหมายสำหรับสกัดคำสำคัญจากเอกสารในเครื่องมือค้นหาข้อมูลเชิงลึก

Using Semantic Graph for Keyword Extraction in Vertical Search Engine

ผู้แต่ง

  • รัชฏา คงคะจันทร์ สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยีมหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ปทุมธานี
  • วสิศ ลิ้มประเสริฐ สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ปทุมธานี
  • ปกป้อง ส่องเมือง สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยีมหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ปทุมธานี
  • ชัยณรงค์ เกษามูล สาขาวิชาคณิตศาสตร์และสถิติ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ปทุมธานี

คำสำคัญ:

การค้นหาแนวตั้ง, เครื่องมือค้นหาโดยใช้ความหมาย, กราฟมโนทัศน์, การสกัดคำสำคัญ, กราฟความหมายของเอกสาร

บทคัดย่อ

          บทความนี้ นำเสนอการใช้กราฟความหมายเป็นแหล่งความรู้ในการเปรียบเทียบเชิงความหมายระหว่างคำสืบค้นและเนื้อหาของเอกสาร กราฟความหมายถูกสร้างโดยอัตโนมัติโดยใช้หลักการทำงานทางด้านการประมวลผลภาษาธรรมชาติซึ่งเป็นส่วนหนึ่งของปัญญาประดิษฐ์ ขั้นตอนในการสร้างกราฟความหมายเริ่มจาก การเตรียมเอกสารเบื้องต้น ซึ่งได้แก่ การตัดคำ การลบคำหยุด และกำกับหน้าที่ของคำ จากนั้นขั้นตอนที่สองเป็นการแจกแจงประโยคโดยใช้วิธีการแจกแจงไวยากรณ์แบบพึ่งพา เพื่อหาความสัมพันธ์ของคำที่อยู่ในประโยค ขั้นตอนที่สามเป็นการแปลงจากความสัมพันธ์ระหว่างคำเป็นกราฟความหมายซึ่งอยู่ในรูปของกราฟมโนทัศน์ และในขั้นตอนสุดท้าย กราฟความหมายที่ได้จะถูกนำมาคำนวณเพื่อหาค่าความสัมพันธ์ของคำและประโยคในเอกสาร เพื่อสกัดเอาคำสำคัญออกมา โดยงานวิจัยนี้ได้ทดลองสร้างกราฟความหมายจากเอกสาร จำนวน 380 เอกสาร ที่รวบรวมมาจาก บทความวิจัยในเว็บไซต์ของ IEEE และ จำนวน 144 เอกสาร จากคลังข้อมูลมาตรฐาน SemEval โดยผลที่ได้จากการสกัดคำสำคัญแบบอัตโนมัติ มีค่าความแม่นยำ ร้อยละ 40 ค่าความครบถ้วน ร้อยละ 53  และ F1-Measure ที่ ร้อยละ 40 ตามลำดับ

Downloads

Download data is not yet available.

References

Page, Larry. PageRank: Bringing Order to the Web. Stanford Digital Library Project [Internet]. 2002 [cited 2020 August 31]. Available from: http://infolab.stanford.edu/~page/papers/pagerank/index.htm

Microsoft Inc. Microsoft's New Search at Bing.com Helps People Make Better Decisions. [Internet]. 2009. [cited 2020 August 31]. Available from: https://news.microsoft.com/2009/05/28/microsofts-new-search-at-bing-com-helps-people-make-better-decisions/

Wu YB, Li Q, Bot RS, Chen X. Domain-Specific Keyphrase Extraction. Proceedings of the 14th ACM international conference on Information and knowledge management; Bremen, Germany, 2005;283-4.

Turney P. Learning algorithms for keyphrase extraction. Information Retrieval 2000;2:303–36.

Tomokiyo T, Hurst M. A Language Model Approach to Keyphrase Extraction. Proceedings of the ACL Workshop on Multiword Expressions; Sapporo, Japan, 2003;33–40.

Barker K, Cornacchia N. Using Noun Phrase Heads to Extract Document Keyphrases. Proceedings of the 13th Biennial Conference of the Canadian Society on Computational Studies of Intelligence; Montreal, Quebec, Canada, 2000:40–52.

Liu F, Pennell D, Liu F, Liu Y. Unsupervised approaches for automatic keyword extraction using meeting transcripts. Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics; Boulder, Colorado, 2009:620–8.

Matsuo Y, Ishizuka M. Keyword extraction from a single document using word co-occurrence statistical information. International Journal on Artificial Intelligence Tools 2004:157-69.

Grineva M, Grinev M, Lizorkin D. Extracting key terms from noisy and multitheme documents. Proceedings of the 18th International Conference on World Wide Web; New York, NY, 2009: 661–7.

Jiang JJ, Conrath DW. Semantic similarity based on corpus statistics and lexical taxonomy. Proceedings of the 10th Research on Computational Linguistics International Conference; Taipei, Taiwan, 1997:19-33.

Lin D. An information-theoretic definition of similarity. Proceedings of the 15th International Conference on Machine Learning; San Francisco, CA, 1998:296-304.

Wu Z, PalmerM. Verb semantics and lexical selection. Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics; Las Cruces New Mexico, 1994:133-8.

BrightEdge.com. What is vertical search optimization or VSO?. [Internet]. 2018. [cited 2020 August 31]. Available from: https://www.brightedge.com/blog/vso-vertical-search-optimization

Long B, Chang Y. Relevance Ranking for Vertical Search Engines; Morgan Kaufmann, ISBN: 978-0-12-407171-1, 2014.

Kim SN, Medelyan O, Kan MY, Baldwin T. SemEval-2010 Task 5 : Automatic Keyphrase Extraction from Scientific Articles. Proceedings of the 5th International Workshop on Semantic Evaluation; Uppsala, Sweden; 2010: 21-6.

Sowa JF. Conceptual Graph Standard and Extension. Conceptual Structures: Theory, Tools and Applications. Proceedings of the 6th International Conference on Conceptual Structures; Montpellier, France. August 10-12, 1998:3-14.

Mihalcea R, Tarau P. Textrank: Bringing order into text. Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing; Barcelona, Spain, 2004: 404–11.

Bougouin A , Boudin F , Daille B. TopicRank: Graph-Based Topic Ranking for Keyphrase Extraction. Proceedings of the International Joint Conference on Natural Language Processing (IJCNLP); Nagoya, Japan, 2013:543-51.

Downloads

เผยแพร่แล้ว

2024-07-01

How to Cite

1.
คงคะจันทร์ ร, ลิ้มประเสริฐ ว, ส่องเมือง ป, เกษามูล ช. การใช้กราฟความหมายสำหรับสกัดคำสำคัญจากเอกสารในเครื่องมือค้นหาข้อมูลเชิงลึก: Using Semantic Graph for Keyword Extraction in Vertical Search Engine. AdvSciJ [อินเทอร์เน็ต]. 1 กรกฎาคม 2024 [อ้างถึง 9 มีนาคม 2025];24(2):197-213. available at: https://li02.tci-thaijo.org/index.php/adscij/article/view/723