精度和召回率有什么关系?
精确率(Precision ratio,简称P)是指检测到的相关文档占检测到的文档总数的百分比。查准率反映了检索的准确性,它的补充是误检率。召回率(简称R)是指在系统中检测到的相关文档的百分比。查全率反映了检索的全面性,它的补充是漏检率。
查全率=(检索到的相关信息量/系统中相关信息总量)*100%。精确率=(检索到的相关信息/检索到的总信息)*100%。利用这两个定量指标,也可以评价信息检索系统的性能水平。为了评估一个信息检索系统的性能水平,有必要在一个检索系统中进行多次检索。每进行一次搜索,计算一次查准率和查全率,作为坐标值,标注在平面坐标图上。通过大量的检索,可以得到检索系统的性能曲线。
实验表明,召回率和准确率之间存在相反的相互依赖关系——如果输出的召回率提高,其准确率就会降低,反之亦然。理解了召回率和精度的关系,如果召回率提高了,就意味着中间的阴影部分变大了,系统中相关文档的总量应该保持不变。但准确率的提高与检测的总次数有关。事实上,如果你想找到更多的相关性,就会有更多的无关检测,即图片中的浅蓝色部分也会变大,导致准确率降低。