小编A. *_*tia的帖子

使用Keras进行物体检测:更快的R-CNN或YOLO的简单方法

这个问题可能已得到解答,但我没有找到一个简单的答案.我使用Keras创建了一个convnet来对"辛普森一家"字符进行分类(这里是数据集).
我有20个类并给出一个图像作为输入,我返回字符名称.这很简单.我的数据集包含图片中主要字符的图片,并且只有字符的名称作为标签.

现在我想添加一个对象检测问题,即在图片中的字符周围绘制一个边界框并预测它是哪个字符.我不想使用滑动窗口,因为它真的很慢.所以我考虑使用更快的RCNN(github repo)或YOLO(github repo).我是否应该为训练集的每张图片添加边界框的坐标?有没有办法在没有给出训练集的坐标的情况下进行物体检测(并在我的测试中得到边界框)?

总之,我想创建一个简单的对象检测模型,我不知道是否有可能创建一个更简单的YOLO或更快的RCNN.

非常感谢您的帮助.

classification object-detection deep-learning keras

13
推荐指数
1
解决办法
1万
查看次数

TensorFlow - 图像中的文本识别

我是TensorFlow和Deep Learning的新手.我试图识别naturel场景图像中的文本.我曾经使用OCR,但我想使用深度学习.文本的格式始终相同: ABC-DEF 88:88.

我所做的是识别每个字符/数字.这意味着我在每个角色周围裁剪图像(因此每张图片给我10个字符)来构建我的训练和测试集,并构建一个两个转换神经网络.所以我的训练集是一组角色图片,标签只是字符/数字.

但我想更进一步.我想做的只是提供完整的图片并输出整个文本(不是我以前的模型中的一个字符).

预先感谢您的任何帮助.

python text-recognition deep-learning tensorflow

8
推荐指数
1
解决办法
1万
查看次数

TensorFlow - 如何使用不同测试数据集上的训练模型进行预测?

我是TensorFlow的新手,我不知道如何用经过训练的模型对图片进行分类.我已经为我的训练和所有工作建立了一个列车,验证和测试数据集,但我想预测第二个测试数据集(称为test2).我正在对数字图片进行分类.

我试过这个,但它不起作用:

def train_and_predict(restore=False, test_set=None):
    """
    Training of the model, posibility to restore a trained model and predict on another dataset. 
    """
    batch_size = 50
    # Regular datasets for training
    train_dataset, train_labels, test_dataset, test_labels, valid_dataset, valid_labels = load_dataset(dataset_size)
    if restore:
       # change the testset if restoring the trained model
       test_dataset, test_labels = create_dataset(test_set)
       test_dataset, test_labels = reformat(test_dataset, test_labels)
       batch_size = number_predictions

    graph = tf.Graph()
    with graph.as_default():

       # Input data.
       tf_train_dataset = tf.placeholder(tf.float32, shape=(batch_size, image_size, image_size, num_channels))
       tf_train_labels = tf.placeholder(tf.float32, shape=(batch_size, …
Run Code Online (Sandbox Code Playgroud)

python classification prediction deep-learning tensorflow

6
推荐指数
1
解决办法
2万
查看次数

使用虚拟云端硬盘获取 Google 云端硬盘文件链接

我正在使用虚拟云端硬盘访问我的 Google 云端硬盘文件。
所以我在 Python 中有我所有 Google Drive 文件的列表(使用os.path.walk),但我想知道是否有可能获得文件在线链接。
我在 Mac OS X 上使用 Finder,通过二次点击,我有一个选项“用 Google Drive 打开”,它可以直接在我的浏览器上打开文件。我想自动对我的所有文件做同样的事情。

python macos google-drive-api

2
推荐指数
1
解决办法
4456
查看次数

使用 Flask 保存和发送大型 numpy 数组

我正在寻找通过 Flask 发送大型 Numpy 数组(主要由图像组成)的最佳方式。

现在,我现在正在做这样的事情:

服务器端:

np.save(matrix_path, my_array)
return send_file(matrix_path+'.npy') 
Run Code Online (Sandbox Code Playgroud)

客户端:

with open('test_temp', 'wb') as f:
    f.write(r.content)
my_array = np.load('test_temp')
Run Code Online (Sandbox Code Playgroud)

但是 .npy 文件非常大,所以需要很长时间。

我想过使用 h5py 但由于图像具有不同的大小 ( array.shape = (200,)),我不能使用 h5py(为每个图像创建一个数据集会太长)。

有没有人知道如何优化它?

python numpy flask h5py

1
推荐指数
1
解决办法
1446
查看次数