回忆的补语是什么?

查全率是指在系统中检索到的相关页面的百分比。

召回率是指从数据库中检测到的相关信息占总量的比例。召回的绝对值很难计算,只能根据数据库的内容和数量来估计。查全率是衡量检索系统从文献集合中检测相关文档是否成功的指标,即检测到的相关文档占所有相关文档的百分比。

影响召回率的因素有:数据库收录的文献信息不完整;索引词汇缺乏控制性和特异性;词汇结构不完整;词与词之间的关系模糊或不正确;索引未知;索引不一致;标引人员遗漏了原文的重要概念或使用了不恰当的词语。

此外,从信息检索的角度来看,主要有:检索策略过于简单;选词不当,逻辑组合不当;检索途径和方法太少;检索人员不熟练,缺乏耐心;检索系统不具备分词和反馈功能,无法全面描述检索需求。

查全率的局限性在于:它是检索到的相关信息与存储在检索系统中的所有相关信息的比值,但系统中有多少相关信息一般是未知的,只能估计;此外,召回率或多或少受到“假设”的限制,即检索到的相关信息对用户具有相同的价值。

召回率的评估至少包括:

(1)在初步调查结束时。初次检索完成后,必须对专利文献数据库初次检索的查全率进行评估,这是表明检索能否完成的依据。如果此时召回率不理想(比如低于50%),就需要继续召回工作,否则,如果达到预期召回率,就可以结束召回工作。

(2)在去噪过程结束时。去噪过程也称“精确”过程,是将与分析主题无关的专利文献从搜索数据库中剔除的过程。在这个过程中,生效的单据不可避免地会被误删。为了检查去噪过程中是否误删了过多的有效文档,必须在工作结束时对去噪后的专利文档召回率进行评估。