回忆在机器学习中意味着什么?

use*_*717 11 algorithm statistics machine-learning

我知道在搜索引擎中召回的意义,但是召回分类器的意义是什么,例如贝叶斯分类器?请举个例子,谢谢.

例如,Precision =正确/正确+错误的测试数据文档.怎么理解召回?

Ano*_*sse 36

从字面上回想一下,有多少真正的阳性被召回(找到),也就是发现了多少正确的命中.

精确度(你的公式是不正确的)是多少返回的命中是真正的正数,即发现了多少是正确的命中.

实际上,这很简单.


Pat*_*ick 26

我发现维基百科的Precision和Recall的解释非常有用:

假设用于识别照片中的狗的计算机程序识别出包含12只狗和一些猫的图片中的8只狗.在确定的8只狗中,5只实际上是狗(真阳性),其余是猫(假阳性).该计划的精确度为5/8,而其召回率为5/12.当搜索引擎返回30页时,其中只有20页是相关的,而未能返回40个额外的相关页面,其精度为20/30 = 2/3,而其召回率为20/60 = 1/3.

因此,在这种情况下,精确度是"搜索结果的有用程度",并且回想起"结果有多完整".

在此输入图像描述


ami*_*mit 23

ML中的精度与信息检索中的精度相同.

recall = TP / (TP + FN)
precision = TP / (TP + FP)
Run Code Online (Sandbox Code Playgroud)

(其中TP =真阳性,TN =真阴性,FP =假阳性,FN =假阴性).

将这些符号用于二元分类器是有意义的,通常"正"是不太常见的分类.请注意,精度/召回度量实际上是特定形式,其中#class = 2用于更一般的混淆矩阵.

另外,你的"精确"符号实际上是准确性,而且是(TP+TN)/ ALL


haf*_*031 8

给你举个例子。想象一下,我们有一个可以检测猫与狗的机器学习模型。人类提供的实际标签称为真实值。同样,模型的输出称为预测。现在看下表:

ExampleNo        Ground-truth        Model's Prediction
   0                 Cat                   Cat
   1                 Cat                   Dog
   2                 Cat                   Cat
   3                 Dog                   Cat
   4                 Dog                   Dog
Run Code Online (Sandbox Code Playgroud)

假设我们想要找到班级猫的回忆。根据定义,召回率是指正确识别某个类别的百分比(从类别的所有给定示例中)。因此,对于 cat 类,模型正确识别了它 2 次(在示例 0 和 2 中)。但这是否意味着实际上只有两只猫?不!事实上,真实情况中有 3 只猫(人类标记)。那么这个类别的正确识别率是多少呢?2 out of 3 that is (2/3) * 100 % = 66.67%或者0.667如果你将其标准化在 1 之内。这是示例 3 中 cat 的另一个预测,但它不是正确的预测,因此我们不考虑它。

现在来讨论数学公式。首先了解两个术语:

TP(True Positive):当事情实际上是积极的时候却预测为积极的事情。如果猫是我们的正面例子,那么当它实际上是一只猫时,就预测它是一只猫。

FN(假阴性):当实际情况并非阴性时,预测结果为阴性。

现在,对于某个类,该分类器的输出可以有两种类型:猫或狗(不是猫)。所以正确识别的数量就是True Positive(TP)的数量。同样,真实情况中该类别的示例总数将为 TP + FN。因为在所有猫中,模型要么正确检测到它们(TP),要么没有正确检测到它们(FN,即模型错误地表示阴性(非猫),而实际上是阳性(猫))。因此,对于某个类别,TP + FN 表示该类别的基本事实中可用的示例总数。所以公式是:

Recall = TP / (TP + FN)
Run Code Online (Sandbox Code Playgroud)

类似地,也可以计算 Dog 的召回率。当时认为狗是正类,猫是负类。

因此,对于任意数量的类,要查找某个类的召回率,请将该类作为类,将其余类作为类,并使用公式来查找召回率。继续每个班级的过程,以找到所有班级的回忆。

如果您也想了解精度,请访问此处:https ://stackoverflow.com/a/63121274/6907424


小智 5

用非常简单的语言:例如,在一系列展示政客的照片中,有多少次将政客 XY 的照片正确识别为展示的是 A.默克尔而不是其他政客?

  • 精度是识别另一个人的次数(误报)的比率:(正确命中)/(正确命中)+(误报)

  • 召回是照片中显示的人名被错误识别('召回')的次数的比率:(正确调用)/(正确调用)+(错误调用)