如何解决来自 PDFBox 的无 unicode 映射错误?

She*_*lda 5 python java unicode pdfbox

我有一个现有的 PDF 文件,我想使用 python 脚本将其转换为 excel 文件。当前使用 PDFBox,但是有多个类似以下的错误:

org.apache.pdfbox.pdmodel.font.PDType0Font toUnicode
No Unicode mapping for CID+24 (24) in font DroidSansFallback
Run Code Online (Sandbox Code Playgroud)

我可以使用 pdfbox 或其他 java/python 脚本替换 droidsansfallback 字体或将字体替换为另一种字体吗?请帮忙。

小智 -1

使用打印将 PDF 转换为 Microsoft pdf 文件并使用它。它将处理所有字体