基于文本内容的农业网页信息抽取和分类研究
【出 处】:《
情报科学
》
CSSCI
2012年第30卷第7期 1012-1015页,共4页
【作 者】:
朱学芳
[1,2] ;
冯曦曦
[1,2]
【摘 要】
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。
相关热词搜索: 文本 农业网页 信息抽取 分类 text agricultural web information extraction classification