单个关键词出现概率与信息量的关系
【出 处】:
【作 者】:
程莉
吴广印
王鑫
中国科学技术信息研究所
北京100038
【摘 要】基于网络信息检索,从理论上和实证上探讨单个关键词出现概率与信息量的关系。分析不同概率的检索词在需求表达信息量上的差异,在信息需求的多维描述基础上研究高频关键词在需求信息量上对低频关键词的排挤效应。针对这种排挤效应,结合叙词表词间关系提出了关键词归类去重的检索相关性测量方案。