use*_*717 11 algorithm statistics machine-learning
我知道在搜索引擎中召回的意义,但是召回分类器的意义是什么,例如贝叶斯分类器?请举个例子,谢谢.
例如,Precision =正确/正确+错误的测试数据文档.怎么理解召回?
Ano*_*sse 36
从字面上回想一下,有多少真正的阳性被召回(找到),也就是发现了多少正确的命中.
精确度(你的公式是不正确的)是多少返回的命中是真正的正数,即发现了多少是正确的命中.
实际上,这很简单.
Pat*_*ick 26
我发现维基百科的Precision和Recall的解释非常有用:
假设用于识别照片中的狗的计算机程序识别出包含12只狗和一些猫的图片中的8只狗.在确定的8只狗中,5只实际上是狗(真阳性),其余是猫(假阳性).该计划的精确度为5/8,而其召回率为5/12.当搜索引擎返回30页时,其中只有20页是相关的,而未能返回40个额外的相关页面,其精度为20/30 = 2/3,而其召回率为20/60 = 1/3.
因此,在这种情况下,精确度是"搜索结果的有用程度",并且回想起"结果有多完整".
ami*_*mit 23
ML中的精度与信息检索中的精度相同.
recall = TP / (TP + FN)
precision = TP / (TP + FP)
Run Code Online (Sandbox Code Playgroud)
(其中TP =真阳性,TN =真阴性,FP =假阳性,FN =假阴性).
将这些符号用于二元分类器是有意义的,通常"正"是不太常见的分类.请注意,精度/召回度量实际上是特定形式,其中#class = 2用于更一般的混淆矩阵.
另外,你的"精确"符号实际上是准确性,而且是(TP+TN)/ ALL
给你举个例子。想象一下,我们有一个可以检测猫与狗的机器学习模型。人类提供的实际标签称为真实值。同样,模型的输出称为预测。现在看下表:
ExampleNo Ground-truth Model's Prediction
0 Cat Cat
1 Cat Dog
2 Cat Cat
3 Dog Cat
4 Dog Dog
Run Code Online (Sandbox Code Playgroud)
假设我们想要找到班级猫的回忆。根据定义,召回率是指正确识别某个类别的百分比(从该类别的所有给定示例中)。因此,对于 cat 类,模型正确识别了它 2 次(在示例 0 和 2 中)。但这是否意味着实际上只有两只猫?不!事实上,真实情况中有 3 只猫(人类标记)。那么这个类别的正确识别率是多少呢?2 out of 3 that is (2/3) * 100 % = 66.67%或者0.667如果你将其标准化在 1 之内。这是示例 3 中 cat 的另一个预测,但它不是正确的预测,因此我们不考虑它。
现在来讨论数学公式。首先了解两个术语:
TP(True Positive):当事情实际上是积极的时候却预测为积极的事情。如果猫是我们的正面例子,那么当它实际上是一只猫时,就预测它是一只猫。
FN(假阴性):当实际情况并非阴性时,预测结果为阴性。
现在,对于某个类,该分类器的输出可以有两种类型:猫或狗(不是猫)。所以正确识别的数量就是True Positive(TP)的数量。同样,真实情况中该类别的示例总数将为 TP + FN。因为在所有猫中,模型要么正确检测到它们(TP),要么没有正确检测到它们(FN,即模型错误地表示阴性(非猫),而实际上是阳性(猫))。因此,对于某个类别,TP + FN 表示该类别的基本事实中可用的示例总数。所以公式是:
Recall = TP / (TP + FN)
Run Code Online (Sandbox Code Playgroud)
类似地,也可以计算 Dog 的召回率。当时认为狗是正类,猫是负类。
因此,对于任意数量的类,要查找某个类的召回率,请将该类作为正类,将其余类作为负类,并使用公式来查找召回率。继续每个班级的过程,以找到所有班级的回忆。
如果您也想了解精度,请访问此处:https ://stackoverflow.com/a/63121274/6907424
小智 5
用非常简单的语言:例如,在一系列展示政客的照片中,有多少次将政客 XY 的照片正确识别为展示的是 A.默克尔而不是其他政客?
精度是识别另一个人的次数(误报)的比率:(正确命中)/(正确命中)+(误报)
召回是照片中显示的人名被错误识别('召回')的次数的比率:(正确调用)/(正确调用)+(错误调用)
| 归档时间: |
|
| 查看次数: |
24177 次 |
| 最近记录: |