我是机器学习的新手.在阅读有关监督学习,无监督学习,强化学习的同时,我遇到了一个如下问题而感到困惑.请帮我识别下面三个是监督学习,无监督学习,强化学习.
什么类型的学习(如果有的话)最能描述以下三种情况:
(i)为自动售货机创建硬币分类系统.为了做到这一点,开发商从美国造币厂获得精确的硬币规格,并得出尺寸,重量和面额的统计模型,然后自动售货机用它来对其硬币进行分类.
(ii)不是要求美国造币厂获得硬币信息,而是提供一套带有大量标记硬币的算法.该算法使用该数据来推断自动售货机然后用于对其硬币进行分类的决策边界.
(iii)计算机通过反复播放和通过惩罚最终导致失败的动作来调整其策略来制定玩Tic-Tac-Toe的策略.