google-cloud-vision如何阅读pdf文件

Zee*_*han 4 google-cloud-vision

我正在使用Google OCR API,并且正在读取图像和PDF文件,可以读取和处理图像文件,但是对于PDF文件,根据Google OCR API文档,他们提到我们需要将文档存储到Google Cloud服务。

话虽如此,由于数据机密性,我无法将数据存储到Google Cloud中,并希望从本地系统上载PDF以便从PDF文件读取文本。我需要您的输入,是否可以从本地磁盘上传PDF,然后进行处理,而不是将文件上传到Google Cloud?在这方面,您的合作将受到高度赞赏。

此致Zeeshan

Iñi*_*igo 6

如您所说,这不可能在本地完成。我代表您提交了功能请求[1],以便您跟踪那里的更新。

无论如何,我有一个可能的解决方法,可以满足您的数据机密性意识。它包括使用Cloud Storage Client库[2]上传和删除这些文件:

  1. 您在本地拥有PDF文件,没有包含它的存储桶。
  2. 将其上传到存储桶[3]
  3. 使用该存储桶+文件URI通过Cloud Vision API读取它,并将结果存储在存储桶中
  4. 将结果文件下载到本地计算机中[4]
  5. 从存储桶中删除PDF文件和结果文件[5]

只要您不介意在短时间内将这些文件存储在存储桶中,此方法就应该起作用。