Anu*_*pta 11 artificial-intelligence machine-learning prediction deep-learning keras
我为分类(0/1)NLP任务开发了ML模型,并将其部署在生产环境中.向用户显示模型的预测,并且用户可以选择给出反馈(如果预测是正确/错误的话).
如何在模型中不断加入这些反馈?从用户体验的角度来看,你不希望用户为特定输入纠正/教导系统超过两次/三次,系统会快速学习,因此反馈应该"快速"合并.(Google优先收件箱以无缝方式执行此操作)
如何建立我的系统可以改进的"反馈循环"?我在网上搜索了很多但找不到相关资料.任何指针都会有很大的帮助.
请不要说通过包含新数据点从头开始重新训练模型.这肯定不是谷歌和Facebook如何建立他们的智能系统
为了进一步解释我的问题 - 想想谷歌的垃圾邮件检测器或他们的优先收件箱或他们最近的"智能回复"功能.众所周知,他们有能力学习/合并(快速)用户提要.
一直以来它快速整合了用户反馈(即用户必须每个数据点教授系统正确的输出2-3次,并且系统开始为该数据点提供正确的输出)并且它还确保它保持旧的学习和在结合新数据点的学习的同时,不会开始在较旧的数据点上提供错误的输出(它提前提供正确的输出).
我还没有找到任何关于如何构建这样的系统的博客/文献/讨论 - 一个在ML系统中以详细说明循环解释的智能系统
希望我的问题现在更加明确.
更新:我发现的一些相关问题是:
https://datascience.stackexchange.com/questions/1073/libraries-for-online-machine-learning
http://mlwave.com/predicting-click-through-rates-with-online-machine-learning/
更新:我仍然没有具体的答案,但这样的配方确实存在.请阅读以下博客Machine Learning!= Learning Machine中的"从反馈中学习"部分 .在这个Jean谈到"向机器添加反馈摄取循环".同样在这里,这里,4.
构建一个简单的轻型模型,可以根据反馈进行更新。在线机器学习为此提供了许多候选者
大多数好的在线分类器都是线性的。在这种情况下,我们可以拥有几个它们,并通过小型浅层神经网络将它们组合起来实现非线性
| 归档时间: |
|
| 查看次数: |
2989 次 |
| 最近记录: |