如何从 PDFBox 2.0.2 中的 PDDocument 中提取字体

kab*_*hra 5 java pdf fonts pdfbox

我已经在以前的版本中看到了如何执行此操作,如下所示:

如何使用pdfbox提取文本内容的字体样式?

但我认为 getFonts() 方法现在已被删除。我想Map<String, PDFont>在新版本的 PDFBox 中检索文本到字体 ( ) 的映射,但我不知道如何操作。

谢谢

卡比尔

Til*_*err 9

做这个:

PDDocument doc = PDDocument.load("C:/mydoc3.pdf");
for (int i = 0; i < doc.getNumberOfPages(); ++i)
{
    PDPage page = doc.getPage(i);
    PDResources res = page.getResources();
    for (COSName fontName : res.getFontNames())
    {
        PDFont font = res.getFont(fontName);
        // do stuff with the font
    }
}
Run Code Online (Sandbox Code Playgroud)