监督学习,(ii)无监督学习,(iii)强化学习

use*_*536 5 artificial-intelligence machine-learning

我是机器学习的新手.在阅读有关监督学习,无监督学习,强化学习的同时,我遇到了一个如下问题而感到困惑.请帮我识别下面三个是监督学习,无监督学习,强化学习.

什么类型的学习(如果有的话)最能描述以下三种情况:

(i)为自动售货机创建硬币分类系统.为了做到这一点,开发商从美国造币厂获得精确的硬币规格,并得出尺寸,重量和面额的统计模型,然后自动售货机用它来对其硬币进行分类.

(ii)不是要求美国造币厂获得硬币信息,而是提供一套带有大量标记硬币的算法.该算法使用该数据来推断自动售货机然后用于对其硬币进行分类的决策边界.

(iii)计算机通过反复播放和通过惩罚最终导致失败的动作来调整其策略来制定玩Tic-Tac-Toe的策略.

ffr*_*end 2

假设您有表示为矩阵的数据集X。中的每一行X都是一个观察结果(实例),每一列代表特定的变量(特征)。

如果您还拥有(并使用)与观察相对应的标签向量,那么这就是监督学习y的任务。其中涉及“监督者”,它表示哪些观察结果属于#1 类,哪些属于#2 类,等等。

如果您没有观察标签,那么您必须根据X数据集本身做出决策。例如,在硬币的示例中,您可能想要构建硬币参数的正态分布模型,并创建当硬币具有异常参数(因此可能是企图欺诈)时发出信号的系统。在这种情况下,你没有任何类型的主管来说明哪些硬币是可以的以及哪些代表了欺诈企图。因此,它是无监督学习任务

在前面的 2 个示例中,您首先训练了模型,然后使用它,无需对模型进行任何进一步更改。在强化学习中,模型根据处理的数据和结果不断改进。例如,寻找从A点到B点的路径的机器人可能会首先计算移动的参数,然后根据这些参数进行移动,然后分析新的位置并更新移动参数,以便下一步的移动会更加准确(重复直到到达B点)。

基于此,我很确定您能够找到这三种学习与您的项目之间的对应关系。