一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证
【出 处】:
【作 者】:
刘江华
赣南师范学院图书馆
江西赣州341000
【摘 要】【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
相关热词搜索: LDA(潜在狄利克雷分布) 主题模型 聚类分析 文本检索