精度是指检索到的文档满足主题的需求。

精度指的是符合题目需要的文档,这是错误的。

影响准确率的因素如下:

影响查准率的主要因素有:索引词不能准确描述文献主题和检索要求;组装规则不严格;词语的选择和词语之间的关系不正确;弓太细;装配错误;检索中使用的检索词(或检索表达式)的特异性不够,检索范围宽于检索要求;检索系统不具备逻辑否定功能和反馈功能;搜索公式中允许的字数是有限的;截断位置不当,检索公式中逻辑“或”的使用不当等等。

事实上,影响检索效果的因素非常复杂。根据国外专家做的实验,召回率和精确率成反比。要完全搜索,就要逐步放宽检索的范围和限制,结果会带入很多不相关的文档,影响查准率。

试图同时提高查全率和查准率并不容易。一方面强调,一方面忽视,也是不合适的。查全率和查准率要根据具体主题的要求合理调整,保证检索效果。

精度(Precision)是衡量检索系统信噪比的一个指标,即检测到的相关文档与检测到的所有文档的百分比。一般表示为:精度比=(检索到的相关信息量/检索到的总信息量)x100%。

精度比的限制

查准率的局限性表现在:如果检索结果是以标题而非全文的形式出现,由于标题内容简单,用户很难判断检索到的信息是否与主题密切相关,必须找到标题全文才能正确判断信息是否符合检索主题的需求;同时,准确率中提到的相关信息也有“假设”的局限性。

实验表明,查全率和查准率之间存在相反的相互依赖关系:如果提高了输出的查全率,其查准率就会降低;反之亦然。