基于文本内容的农业网页信息抽取和分类研究

学校概况

吉林大学坐落在吉林省省会长春市，是教育部直属的一所全国重点综合性大学，1995年首批..通过国家教委“211工程”审批，2001年被列入“985工程”国家重点建设�...

学校公告

综合新闻

您现在所在位置：首页 > 期刊导读 > 2012年 > 07 > 信息摘要

【出处】：《情报科学》 CSSCI 2012年第30卷第7期 1012-1015页,共4页

【作者】：朱学芳 [1,2] ; 冯曦曦 [1,2]

【摘要】通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。

上一篇：基于云计算的网络协同商务链设计
下一篇：面向特色学科的农业院校图书馆知识服务体系构建