引用本文:刘亚辉,王越,谭暑秋.基于K-均值聚类的朴素贝叶斯网络分类模型(J/M/D/N,J:杂志,M:书,D:论文,N:报纸).期刊名称,2012,29(8):36-41
CHEN X. Adap tive slidingmode contr ol for discrete2ti me multi2inputmulti2 out put systems[ J ]. Aut omatica, 2006, 42(6): 4272-435
【打印本页】   【下载PDF全文】   查看/发表评论  【EndNote】   【RefMan】   【BibTex】
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 1267次   下载 2281 本文二维码信息
码上扫一扫!
分享到: 微信 更多
基于K-均值聚类的朴素贝叶斯网络分类模型
刘亚辉,王越,谭暑秋
作者单位
刘亚辉,王越,谭暑秋  
摘要:
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个“相对融洽点”的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。
关键词:  贝叶斯网络分类  朴素贝叶斯网络  K-均值聚类  数据挖掘
DOI:
分类号:
基金项目:
A Naive Bayesian Network Classification Model Based on K-means Clustering
LIU Ya-hui,WANG Yue,TAN Shu-qiu
Abstract:
According to the low efficiency and low accuracy of the naive Bayesian network classification model in dealing with large number of high-dimensionaldata,by combining Principal Component Analysis and K-means clustering algorithm,this paper gives an improved Naive Bayesian network calssification model.The model abandoned the premise for the relative independence between non-calss attribute variables and class attribute variables.Firstly,we use principal component analysis to reduce the dimensionality of the data set,so the algorithm can focus on the classification problem.The algotithm has also proposed aconcept called "relative fusion point" to effectively improve the performance of the algorithm.Finally,the performance of the algorithm is analyzed,and the improved algorithm is applied to the actual data set for experiment to repair the missing data of the data set,the results show that the algorithm is effective.
Key words:  Bayesian network classification  Naive Bayesian network  K-means clustering  data mining
重庆工商大学学报(自然科学版) 版权所有
地址:中国 重庆市 南岸区学府大道19号 重庆工商大学学术期刊社 邮编:400067
电话:023-62769495 传真:
您是第4752746位访客
关注微信二维码