阻止文本分类的精确度是否有限?

sam*_*ara 3 text nlp classification stemming

我已经阅读了词干损害精确度但提高了文本分类中的召回率.这是怎么发生的?当你阻止你增加查询和样本文件之间的匹配数对吗?

Nic*_*las 9

它总是一样的,如果你提醒回忆,你做一个概括.正因为如此,你正在失去精确度.将词汇合并在一起.

一方面,应该合并在一起的词(例如"粘附"和"粘附")可能在词干之后保持不同; 另一方面,真正不同的词可能被错误地混淆(例如,"实验"和"经验").这些被分别称为下划线错误和过度划分错误.

过度测量会降低精度,并且低位设计会降低召回率.因此,由于没有任何干扰意味着没有超过但最大的欠限误差,因此您的调用率较低且精度较高.

顺便说一下,精确意味着你找到的那些"文件"中有多少是你正在寻找的.召回意味着你收到的所有"文件"中有多少是正确的.