带有Unicode字符的PDF表单

Question

带有Unicode字符的PDF表单

Mik*_*k86 14 pdf unicode itext pdf-form

我目前正在努力处理从LibreOffice文档创建的PDF表单.

我按照"iText in Action"一书中的建议创建了它,现在我试图用一些可以包含Unicode字符的值预先填充嵌入的表单.

这包括一个由base char组成的字符,另外还有一个char(eG M)组合.

我在stackoverflow 和本书中尝试了几个不同的提示 ,但是我从来没有得到一个可以在所有平台上运行的表单的PDF文档:Linux(Okular,Evince,Acrobat DC,macOS Previewer等)

我知道我需要一个字体,覆盖字符并完全嵌入字体.下面是我用来存档PDF文档和PDF文件的代码.

我的问题是:

PDF规范的不同行为是PDF规范中的弱点,我不得不忍受它吗？
特别是Linux PDF阅读器和Acrobat表现得很糟糕.有没有已知的错误？
我对PDF的内部不是很熟悉,所以有什么建议吗？我的PDF文件的内容是否正常？
有关如何改进代码以获得更好结果的任何建议？

填写表格的代码:

BaseFont uniFont = BaseFont.createFont("./src/main/resources/UnicodeDoc.ttf", BaseFont.IDENTITY_H, BaseFont.EMBEDDED, false, null, null, false);
uniFont.setSubset(false);

// Debugging code...
for (String codepage : uniFont.getCodePagesSupported()) {
    System.out.println("Codepage = " + codepage);
}

FileInputStream fis = new FileInputStream(src);
ByteArrayOutputStream baos = new ByteArrayOutputStream();
PdfReader reader = new PdfReader(fis);
PdfStamper stamper = new PdfStamper(reader, baos);

// Fill all fields in PDF form
String text = "aM\u0302a"; // Same as "aM?a"
com.itextpdf.text.pdf.AcroFields form = stamper.getAcroFields();
for (String fname : form.getFields().keySet()) {
    System.out.println("form." + fname);
    form.setField(fname, text);
    form.setFieldProperty(fname, "textfont", uniFont, null);
}
form.setGenerateAppearances(true);
form.addSubstitutionFont(uniFont);
stamper.setFormFlattening(false);
stamper.close();
reader.close();

Run Code Online (Sandbox Code Playgroud)

提前谢谢,Mik86