基于共词分析的文本主题词聚类与主题发现
【出 处】:《
情报科学
》
CSSCI
2011年第29卷第11期 1621-1624页,共4页
【作 者】:
王小华
;
徐宁
;
谌志群
【摘 要】
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。
相关热词搜索: 共词分析 TF-IDF 共词矩阵 Bisecting K-means 主题 string by filting the stop words and TF-IDF keywords extraction technique next we constructed the Co-word matrix Last we analysed keywords string in clustering through Bisecting K-means