基于可扩展LDA模型的微博话题特征抽取研究
【出 处】:
【作 者】:
邱明涛
马静
张磊
姚兆旭
南京航空航天大学经济与管理学院
江苏南京210016
【摘 要】【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
上一篇:突发传染病微博影响力的预测研究
下一篇:社交媒体用户信息共享影响因素模型构建