小编Dav*_*ghi的帖子

Google Vision API无法识别个位数字

我有一个项目,它使用Google Vision API DOCUMENT_TEXT_DETECTION来从文档图像中提取文本.

通常,API在识别单个数字时会遇到麻烦,如下图所示:

在此输入图像描述

我想这个问题可能与某些噪声消除算法有关,它将孤立的单个数字识别为噪声.有没有办法在这些情况下改善视力反应?(例如管理噪声阈值或其他参数)

在其他时候,Vision会将数字与字母混淆:

在此输入图像描述

但如果我指定为参数languageHints ='en'或'mt',则ocr会忽略这些数字.有没有办法强制识别数字或拉丁字符?

ocr text-recognition google-cloud-platform google-cloud-vision

14
推荐指数
1
解决办法
1250
查看次数

如何通过Python脚本在Google Cloud Storage上上传字节图像

我想通过python脚本在Google Cloud Storage上上传图像。这是我的代码:

from oauth2client.service_account import ServiceAccountCredentials
from googleapiclient import discovery

scopes = ['https://www.googleapis.com/auth/devstorage.full_control']
credentials = ServiceAccountCredentials.from_json_keyfile_name('serviceAccount.json', scop
es)
service = discovery.build('storage','v1',credentials = credentials)

body = {'name':'my_image.jpg'}

req = service.objects().insert(
   bucket='my_bucket', body=body,
   media_body=googleapiclient.http.MediaIoBaseUpload(
      gcs_image, 'application/octet-stream'))

resp = req.execute()
Run Code Online (Sandbox Code Playgroud)

如果gcs_image = open('img.jpg', 'r')代码有效并且可以将我的映像正确保存在Cloud Storage中。如何直接上传字节图像?(例如,从一个的OpenCV / numpy的数组:gcs_image = cv2.imread('img.jpg')

python opencv google-cloud-storage google-cloud-platform

5
推荐指数
3
解决办法
2182
查看次数

如何在Google机器学习中将jpeg图像转换为json文件

我正在研究Google Cloud ML,我希望能够预测jpeg图像.为此,我想使用:

gcloud beta ml预测--instances = INSTANCES --model = MODEL [--version = VERSION]

(https://cloud.google.com/ml/reference/commandline/predict)

Instances是json文件的路径,其中包含有关image的所有信息.如何从jpeg图像创建json文件?

非常感谢!!

python json jpeg tensorflow google-cloud-ml

4
推荐指数
1
解决办法
1934
查看次数

从机器学习算法中获得负面结果

我有一组特定对象的图像.我想找到其中一些是否与机器学习算法有异常.例如,如果我有许多眼镜照片,我想找到其中一个是破损或有异常的东西.像这样的东西:

好!! 在此输入图像描述

坏!! 在此输入图像描述

(显然我会用同样的眼镜...)

问题是我不知道每一个负面情况,所以,对于训练,我只有正面的图像.

换句话说,我想要一种识别图像是否与数据集不同的算法.你有什么建议吗?

特别是有没有办法使用卷积神经网络?

opencv machine-learning tensorflow

4
推荐指数
1
解决办法
149
查看次数