我有一个项目,它使用Google Vision API DOCUMENT_TEXT_DETECTION来从文档图像中提取文本.
通常,API在识别单个数字时会遇到麻烦,如下图所示:
我想这个问题可能与某些噪声消除算法有关,它将孤立的单个数字识别为噪声.有没有办法在这些情况下改善视力反应?(例如管理噪声阈值或其他参数)
在其他时候,Vision会将数字与字母混淆:
但如果我指定为参数languageHints ='en'或'mt',则ocr会忽略这些数字.有没有办法强制识别数字或拉丁字符?
ocr text-recognition google-cloud-platform google-cloud-vision
我想通过python脚本在Google Cloud Storage上上传图像。这是我的代码:
from oauth2client.service_account import ServiceAccountCredentials
from googleapiclient import discovery
scopes = ['https://www.googleapis.com/auth/devstorage.full_control']
credentials = ServiceAccountCredentials.from_json_keyfile_name('serviceAccount.json', scop
es)
service = discovery.build('storage','v1',credentials = credentials)
body = {'name':'my_image.jpg'}
req = service.objects().insert(
bucket='my_bucket', body=body,
media_body=googleapiclient.http.MediaIoBaseUpload(
gcs_image, 'application/octet-stream'))
resp = req.execute()
Run Code Online (Sandbox Code Playgroud)
如果gcs_image = open('img.jpg', 'r')代码有效并且可以将我的映像正确保存在Cloud Storage中。如何直接上传字节图像?(例如,从一个的OpenCV / numpy的数组:gcs_image = cv2.imread('img.jpg'))
我正在研究Google Cloud ML,我希望能够预测jpeg图像.为此,我想使用:
gcloud beta ml预测--instances = INSTANCES --model = MODEL [--version = VERSION]
(https://cloud.google.com/ml/reference/commandline/predict)
Instances是json文件的路径,其中包含有关image的所有信息.如何从jpeg图像创建json文件?
非常感谢!!
我有一组特定对象的图像.我想找到其中一些是否与机器学习算法有异常.例如,如果我有许多眼镜照片,我想找到其中一个是破损或有异常的东西.像这样的东西:
(显然我会用同样的眼镜...)
问题是我不知道每一个负面情况,所以,对于训练,我只有正面的图像.
换句话说,我想要一种识别图像是否与数据集不同的算法.你有什么建议吗?
特别是有没有办法使用卷积神经网络?