回忆在机器学习中意味着什么？

Question

回忆在机器学习中意味着什么？

use*_*717 11 algorithm statistics machine-learning

我知道在搜索引擎中召回的意义,但是召回分类器的意义是什么,例如贝叶斯分类器？请举个例子,谢谢.

例如,Precision =正确/正确+错误的测试数据文档.怎么理解召回？

Answer 1

Ano*_*sse 36

从字面上回想一下,有多少真正的阳性被召回(找到),也就是发现了多少正确的命中.

精确度(你的公式是不正确的)是多少返回的命中是真正的正数,即发现了多少是正确的命中.

实际上,这很简单.

Answer 2

Pat*_*ick 26

我发现维基百科的Precision和Recall的解释非常有用:

假设用于识别照片中的狗的计算机程序识别出包含12只狗和一些猫的图片中的8只狗.在确定的8只狗中,5只实际上是狗(真阳性),其余是猫(假阳性).该计划的精确度为5/8,而其召回率为5/12.当搜索引擎返回30页时,其中只有20页是相关的,而未能返回40个额外的相关页面,其精度为20/30 = 2/3,而其召回率为20/60 = 1/3.

因此,在这种情况下,精确度是"搜索结果的有用程度",并且回想起"结果有多完整".

Answer 3

ami*_*mit 23

ML中的精度与信息检索中的精度相同.

recall = TP / (TP + FN)
precision = TP / (TP + FP)

Run Code Online (Sandbox Code Playgroud)

(其中TP =真阳性,TN =真阴性,FP =假阳性,FN =假阴性).

将这些符号用于二元分类器是有意义的,通常"正"是不太常见的分类.请注意,精度/召回度量实际上是特定形式,其中#class = 2用于更一般的混淆矩阵.

另外,你的"精确"符号实际上是准确性,而且是(TP+TN)/ ALL

Answer 4

haf*_*031 8

给你举个例子。想象一下，我们有一个可以检测猫与狗的机器学习模型。人类提供的实际标签称为真实值。同样，模型的输出称为预测。现在看下表：

ExampleNo        Ground-truth        Model's Prediction
   0                 Cat                   Cat
   1                 Cat                   Dog
   2                 Cat                   Cat
   3                 Dog                   Cat
   4                 Dog                   Dog

Run Code Online (Sandbox Code Playgroud)

假设我们想要找到班级猫的回忆。根据定义，召回率是指正确识别某个类别的百分比（从该类别的所有给定示例中）。因此，对于 cat 类，模型正确识别了它 2 次（在示例 0 和 2 中）。但这是否意味着实际上只有两只猫？不！事实上，真实情况中有 3 只猫（人类标记）。那么这个类别的正确识别率是多少呢？2 out of 3 that is (2/3) * 100 % = 66.67%或者0.667如果你将其标准化在 1 之内。这是示例 3 中 cat 的另一个预测，但它不是正确的预测，因此我们不考虑它。

现在来讨论数学公式。首先了解两个术语：

TP（True Positive）：当事情实际上是积极的时候却预测为积极的事情。如果猫是我们的正面例子，那么当它实际上是一只猫时，就预测它是一只猫。

FN（假阴性）：当实际情况并非阴性时，预测结果为阴性。

现在，对于某个类，该分类器的输出可以有两种类型：猫或狗（不是猫）。所以正确识别的数量就是True Positive（TP）的数量。同样，真实情况中该类别的示例总数将为 TP + FN。因为在所有猫中，模型要么正确检测到它们（TP），要么没有正确检测到它们（FN，即模型错误地表示阴性（非猫），而实际上是阳性（猫））。因此，对于某个类别，TP + FN 表示该类别的基本事实中可用的示例总数。所以公式是：

Recall = TP / (TP + FN)

Run Code Online (Sandbox Code Playgroud)

类似地，也可以计算 Dog 的召回率。当时认为狗是正类，猫是负类。

因此，对于任意数量的类，要查找某个类的召回率，请将该类作为正类，将其余类作为负类，并使用公式来查找召回率。继续每个班级的过程，以找到所有班级的回忆。

如果您也想了解精度，请访问此处：https ://stackoverflow.com/a/63121274/6907424

Answer 5

小智 5

用非常简单的语言：例如，在一系列展示政客的照片中，有多少次将政客 XY 的照片正确识别为展示的是 A.默克尔而不是其他政客？

精度是识别另一个人的次数（误报）的比率：（正确命中）/（正确命中）+（误报）
召回是照片中显示的人名被错误识别（'召回'）的次数的比率：（正确调用）/（正确调用）+（错误调用）

归档时间：	13 年，5 月前
查看次数：	24177 次
最近记录：	8 年，11 月前