引用本文:王涛,李明.基于LDA模型与语义网络对评论文本挖掘研究(J/M/D/N,J:杂志,M:书,D:论文,N:报纸).期刊名称,2019,36(4):9-16
CHEN X. Adap tive slidingmode contr ol for discrete2ti me multi2inputmulti2 out put systems[ J ]. Aut omatica, 2006, 42(6): 4272-435
【打印本页】   【下载PDF全文】   查看/发表评论  【EndNote】   【RefMan】   【BibTex】
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 1510次   下载 179 本文二维码信息
码上扫一扫!
分享到: 微信 更多
基于LDA模型与语义网络对评论文本挖掘研究
王涛,李明1
重庆师范大学 计算机与信息科学学院,重庆 401331
摘要:
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。
关键词:  LDA主题模型  文本聚类  语义关联  情感分析
DOI:
分类号:
基金项目:
Research on Comment Text Mining Based on LDA Model and Semantic Network
WANG Tao,LI Ming
Abstract:
The topic text and the semantic network are used to mine the comment texts in the travel e-commerce, thereby guiding consumers and businesses to make important decisions on the comment information. This paper proposes a method based on LDA (Latent Dirichlet Allocation,LDA) topic clustering and semantic network model (LDA topic clustering and semantic network model,LTC-SNM) to study the online commentary text of hotels.Firstly, the online review text is obtained for data preprocessing, Word2vec is used to generate the word vector, and the machine learning algorithm is used to classify the comment text. Secondly, the classified text is clustered by the LDA theme model to generate the hotel’s feature keywords. Finally, through ROSTCM, feature subject words and modified emotional words are generated into a semantic network, which alleviates the complexity of mining text information. The experimental results show that the proposed LTC-SNM text mining method makes the topic of online user evaluation more expressive.
Key words:  LDA topic model  text clustering  semantic association  sentiment analysis
重庆工商大学学报(自然科学版) 版权所有
地址:中国 重庆市 南岸区学府大道19号 重庆工商大学学术期刊社 邮编:400067
电话:023-62769495 传真:
您是第5742876位访客
关注微信二维码