基于维基语义扩展的微博话题追踪模型研究
【出 处】:
【作 者】:
唐晓波
王中勤
钟林霞
武汉大学信息系统研究中心
湖北武汉430072
武汉大学信息管理学院
湖北武汉430072
【摘 要】【目的/意义】微博话题追踪有利于提高舆情分析系统获取数据的效率和质量,从而为舆情引导等决策提供准确的情报支持。【方法/过程】本文针对微博文本语义稀疏问题和话题漂移问题,构建一个基于维基语义扩展的微博话题追踪模型。该模型首先利用半结构化的维基百科文档构建维基知识库;然后使用维基知识库对微博文本特征向量进行语义扩展,提高微博文本向量的描述能力,降低话题追踪对初始话题数量的敏感度;最后使用支持向量机(Support Vector Machine,SVM)实现语义层次上的微博话题追踪,并且在追踪过程中不断更新SVM分类器来解决话题漂移的问题。【结果/结论】实验结果表明,与传统方法相比,本文方法能够有效地提高微博话题追踪的性能。