PDF 是一个非常复杂的规范,可能会创建如此多的变体,以至于无法可靠地解析,除非您使用与创建它相同的工具来读取它(而且通常甚至不使用)。有几种工具可以将 PDF 压缩为文本字符串(例如 pdf2text),并且可以搜索这些工具,但它不可靠。
许多 PDF 工具仅实现部分规范。有些人建议搜索 PDF 的最佳方法是将其缩小为图像,然后对其进行 OCR。
| 归档时间: |
|
| 查看次数: |
7055 次 |
| 最近记录: |