现在我正在做一个项目,我必须找到该 PDF 文件中每个段落的字体大小。我尝试过各种Python库,如fitz、PyPDF2、pdfrw、pdfminer、pdfreader。所有库都会获取文本数据,但我不知道如何获取段落的字体大小。预先感谢..感谢您的帮助。
我已经尝试过,但未能获得字体大小。
import fitz
filepath = '/home/user/Downloads/abc.pdf'
text = ''
with fitz.open(filepath ) as doc:
for page in doc:
text+= page.getText()
print(text)
Run Code Online (Sandbox Code Playgroud)