我试图利用Computer Vision API对作为扫描文档但被视为图像PDF的PDF文件进行OCR。
我已经对其进行了测试,它告诉我PDF是“ InvalidImageFormat”,“输入数据不是有效的图像”。当我在PNG上进行测试时,它可以完美运行。
是否有针对PDF图像使用API的方法,或者可以结合使用Azure API来使用PDF> PNG>文本?
pdf ocr microsoft-cognitive
microsoft-cognitive ×1
ocr ×1
pdf ×1