我对机器学习/ python/ubuntu比较新.
我有一组.jpg格式的图像,其中一半包含我想要学习的功能,一半不需要.我找不到将它们转换为所需的lmdb格式的方法.
我有必要的文本输入文件.
我的问题是,任何人都可以提供有关如何convert_imageset.cpp
在ubuntu终端中使用的分步指南吗?
谢谢
machine-learning image-processing computer-vision deep-learning caffe
我有一个有多个标签的图像数据集; 数据集中有100个类,每个图像都有1到5个与之关联的标签.
我正在按照以下URL中的说明操作:
https://github.com/BVLC/caffe/issues/550
它说我需要生成一个文本文件,列出图像及其标签,如
Run Code Online (Sandbox Code Playgroud)/home/my_test_dir/picture-foo.jpg 0 /home/my_test_dir/picture-foo1.jpg 1
在我的情况下,由于我有多标签图像,它是否可以简单地添加标签,如下所示?
Run Code Online (Sandbox Code Playgroud)/home/my_test_dir/picture-foo.jpg 0 2 5 /home/my_test_dir/picture-foo1.jpg 1 4
我有一种感觉,它可能不会那么简单,如果我是对的,在什么步骤,我应该如何在设置Caffe的过程中整合数据集的多标签?
neural-network multilabel-classification deep-learning caffe
我正在尝试使用caffe构建一个深度学习模型进行显着性分析(我正在使用python包装器).但我无法理解如何为此目的生成lmdb数据结构.我已经浏览了Imagenet和mnist示例,我知道我应该以格式生成标签
my_test_dir/picture-foo.jpg 0
Run Code Online (Sandbox Code Playgroud)
但在我的情况下,我将用0或1标记每个像素,指示该像素是否显着.这不是图像的单个标签.
如何为每个像素的标签生成lmdb文件?
我是caffe框架的新手,我想使用caffe实施带有多标签的培训。我使用两个LMDB分别保存数据和标签。数据LMDB的尺寸为Nx1xHxW,而标签LMDB的尺寸为Nx1x1x3。标签是浮点数据。
文本文件如下:
5911 3
train/train_data/4224.bmp 13 0 12
train/train_data/3625.bmp 11 3 7
... ...
Run Code Online (Sandbox Code Playgroud)
我使用C ++创建LMDB。我的main.cpp:
#include <algorithm>
#include <fstream> // NOLINT(readability/streams)
#include <string>
#include <utility>
#include <vector>
#include <QImage>
#include "boost/scoped_ptr.hpp"
#include "gflags/gflags.h"
#include "glog/logging.h"
#include "caffe/proto/caffe.pb.h"
#include "caffe/util/db.hpp"
#include "caffe/util/format.hpp"
#include "caffe/util/rng.hpp"
#include <boost/filesystem.hpp>
#include <iomanip>
#include <iostream> // NOLINT(readability/streams)
#include <string>
#include "google/protobuf/message.h"
#include "caffe/common.hpp"
#include "caffe/proto/caffe.pb.h"
#include "caffe/util/format.hpp"
#ifndef CAFFE_TMP_DIR_RETRIES
#define CAFFE_TMP_DIR_RETRIES 100
#endif
using namespace caffe; // NOLINT(build/namespaces)
using std::pair;
using boost::scoped_ptr;
const char *dat_lab="/home/mul/caffe-master/examples/2D_3D/new/info/train.data"; …
Run Code Online (Sandbox Code Playgroud) 我想为caffe中的语义分段创建一个自定义丢失层,需要多个输入.我希望这种损失函数具有额外的输入因子,以便惩罚小物体中的未命中检测.
为此,我创建了一个图像GT,其中包含每个像素的权重.如果像素属于小物体,则重量很高.
我是caffe的新手,我不知道如何同时为我的网络提供三个2-D信号(图像,gt-mask和每像素权重).我怀疑caffe如何处理rgb数据和gt数据之间的对应关系.
我想扩展这个以便为类标签图像设置2 gt,而将另一个设置为丢失功能.
你能给出一些暗示以达到这个目的吗?
谢谢,
computer-vision neural-network image-segmentation deep-learning caffe