当输入大小不同时,如何进行机器学习?

rho*_*ron 7 machine-learning neural-network deep-learning

在标准的食谱机器学习中,我们在矩形矩阵上操作; 也就是说,我们所有的数据点都具有相同数量的功能.我们如何应对所有数据点具有不同数量的特征的情况?例如,如果我们想要进行视觉分类,但我们所有的图片都有不同的维度,或者我们想要进行情感分析,但我们所有的句子都有不同的单词数量,或者我们想要进行恒星分类但是已观察到恒星的次数不同等.

我认为通常的方法是从这些不规则大小的数据中提取常规大小的特征.但是我最近参加了一个关于深度学习的演讲,演讲者强调说,深度学习者不是手工制作数据中的特征,而是能够自己学习相应的特征.但是,如果输入层不是固定大小,我们如何使用例如神经网络?

IVl*_*lad 2

您通常可以很容易地使所有实例的特征数量相同:

如果我们想要进行视觉分类,但我们所有的图片都有不同的尺寸

将它们全部调整为特定尺寸/像素数。

如果我们想做情感分析,但我们所有的句子都有不同数量的单词

k保留所有文本数据中单词的字典。每个实例将包含一个大小的布尔向量k,其中i如果字典中的单词出现在该实例中,则第 -th 条目为真i(这不是最好的表示,但许多表示都基于它)。请参阅词袋模型。

如果我们想要进行恒星分类,但所有恒星被观测的次数都不同

以已观察到的所有恒星的特征为例。

但我最近参加了一次关于深度学习的演讲,演讲者强调,深度学习者不需要从数据中手工制作特征,而是能够自己学习适当的特征。

我认为演讲者可能提到了更高级别的功能。例如,如果要检测图像中的人脸,则不应手动提取“包含鼻子”特征。您应该向其提供原始像素,深度学习器将在更深层次的某个位置学习“包含鼻子”特征。