在Numpy矩阵上调用Google Cloud Vision API

Question

我正在使用Google Text检测API对图像执行OCR。

我发现当我使用opencv对图像进行一些预处理时，OCR结果要好得多。

我的问题是-我如何在内存中以Numpy数组的形式调用Google cloud Vision API？官方的Google文档仅显示视觉api接受磁盘中的图像作为输入。

我想避免不必要的磁盘写入。

Answer 1

向Google Cloud Vison API提供图像的一种方法是作为base64编码的字符串。该快速启动例如使用Python客户端API，它接受用于图像内容的字节流。

无需写入文件，您可以将OpenCV图像编码img为字节字符串，而可以直接传递给Cloud Vision API：

image = vision_client.image(content=cv2.imencode('.jpg', img)[1].tostring())