一般来说,甚至不可能逐页分离原生PDF 文件的内容(当文件采用 Base64 编码时就不可能这样做,正如您将看到的)。
PDF 文件最通用的结构按以下顺序排列:
您不能假设 PDF 对象在文件中的显示顺序与页面在 PDF 查看器中的显示顺序相同。
如果您提取单个页面,则该页面本身需要是一个有效的 PDF 文档:包含(按相同顺序)标题、对象、外部参照和预告片,其中外部参照和预告片需要重新构建,以便它们与新文档匹配(外部参照和预告片不能简单地从原始文档复制)。
因此,您需要先对 Base64 编码的文件进行完全解码,然后才能考虑访问生成的 PDF 的单个页面。
要从已使用 base64 编码的 5 页 PDF 文档中获取所有单独的 PDF 页面作为 base64,您必须执行以下步骤:
| 归档时间: |
|
| 查看次数: |
6729 次 |
| 最近记录: |