我想我们可能能够编译一些执行多类别分类的方法的含咖啡因的描述.
通过多类别分类,我的意思是:输入数据包含多个模型输出类别的表示和/或简单地在多个模型输出类别下可分类.
例如,包含猫和狗的图像将为猫和狗预测类别输出(理想地)~1,对于所有其他类别输出~0.
基于这篇论文,这个陈旧而封闭的PR和这个开放的公关,似乎caffe完全有能力接受标签.它是否正确?
这种网络的构建是否需要使用多个神经元(内积 - > relu - >内积)和softmax层,如本文第13页所述 ; 或者Caffe的ip&softmax目前是否支持多种标签尺寸?
当我将标签传递给网络时,示例将说明正确的方法(如果不是两者)?:
例如猫吃苹果注意:Python语法,但我使用c ++源代码.
第0列 - 类输入; 第1列 - 类不在输入中
[[1,0], # Apple
[0,1], # Baseball
[1,0], # Cat
[0,1]] # Dog
Run Code Online (Sandbox Code Playgroud)
要么
第0列 - 类在输入中
[[1], # Apple
[0], # Baseball
[1], # Cat
[0]] # Dog
Run Code Online (Sandbox Code Playgroud)如果有什么不清楚,请告诉我,我将生成我想问的问题的图片示例.
我正在使用caffe进行回归,而我test.txt和train.txt文件是这样的:
/home/foo/caffe/data/finetune/flickr/3860781056.jpg 2.0
/home/foo/caffe/data/finetune/flickr/4559004485.jpg 3.6
/home/foo/caffe/data/finetune/flickr/3208038920.jpg 3.2
/home/foo/caffe/data/finetune/flickr/6170430622.jpg 4.0
/home/foo/caffe/data/finetune/flickr/7508671542.jpg 2.7272
Run Code Online (Sandbox Code Playgroud)
我的问题是,当我在阅读时使用浮动标签时,似乎caffe不允许像2.0这样的浮动标签,例如'test.txt'文件caffe只能识别
共1张图片
这是错的.
但是当我例如将文件中的2.0更改为2并且以下行相同时,caffe现在给出了
共2张图片
暗示浮动标签是造成问题的原因.
任何人都可以帮助我,解决这个问题,我肯定需要使用浮动标签进行回归,所以有人知道解决方案或解决方案吗?提前致谢.
编辑 对于任何面临类似问题的人来说,使用caffe来训练Lenet的CSV数据可能会有所帮助.感谢@Shai.