检查 PDF 是否为 PDF/A 1-a 格式或不在 Java 中使用 PDFBOX

sam*_*ngh 4 java pdf pdfa pdfbox

我必须检查 pdf 文件是否为 PDF/A 1-a 格式或未使用 pdfbox 或 java 中的任何其他免费库。在这方面,我在谷歌上搜索了很多,但仍然无法获得任何代码或技术。

我如何在 java 中检查这个。

Mar*_*ger 6

pdfbox 中的文档显示了如何进行 PDF/A-1b 验证:

https://pdfbox.apache.org/cookbook/pdfavalidation.html

要进行 pdf/a-1a 验证,您只需更改:

  parser.parse();
Run Code Online (Sandbox Code Playgroud)

到:

 parser.parse(Format.PDF_A1A);
Run Code Online (Sandbox Code Playgroud)

通过阅读位于此处的解析器源代码,我能够确定这一点:

http://grepcode.com/file/repo1.maven.org/maven2/org.apache.pdfbox/preflight/1.8.2/org/apache/pdfbox/preflight/parser/PreflightParser.java