以编程方式检查PDF文件是否完全扫描的最佳方法是什么?我有iText和PDFBox供我使用.我可以检查pdf文件是否包含文本,并根据结果来确定此文件是否为OCR,但此解决方案不是100%准确.我想知道是否有另一种方法可以解决这个问题.
如您所知,解决方案必须基于Java.
java pdf ocr
java ×1
ocr ×1
pdf ×1