Tha*_*eed 3 python numpy google-api google-compute-engine google-cloud-functions
我正在使用Google Text检测API对图像执行OCR。
我发现当我使用opencv对图像进行一些预处理时,OCR结果要好得多。
我的问题是-我如何在内存中以Numpy数组的形式调用Google cloud Vision API?官方的Google文档仅显示视觉api接受磁盘中的图像作为输入。
我想避免不必要的磁盘写入。
向Google Cloud Vison API提供图像的一种方法是作为base64编码的字符串。该快速启动例如使用Python客户端API,它接受用于图像内容的字节流。
无需写入文件,您可以将OpenCV图像编码img为字节字符串,而可以直接传递给Cloud Vision API:
image = vision_client.image(content=cv2.imencode('.jpg', img)[1].tostring())
Run Code Online (Sandbox Code Playgroud)