如何使用pdfbox提取文本内容的字体样式?

Mas*_*oke 4 java pdfbox

我正在使用pdfbox库从pdf文件中提取文本内容.我可以提取所有文本,但找不到提取字体样式的方法.

小智 15

这不是提取字体的正确方法.要阅读字体,必须遍历pdf页面并提取字体,如下所示:

PDDocument  doc = PDDocument.load("C:/mydoc3.pdf");
List<PDPage> pages = doc.getDocumentCatalog().getAllPages();
for(PDPage page:pages){
    Map<String,PDFont> pageFonts=page.getResources().getFonts();
}
Run Code Online (Sandbox Code Playgroud)