从PDF文件中提取标题?

Zel*_*luX 14 python pdf

我想编写一个脚本来自动重命名下载的论文及其标题,我想知道是否有任何我可以使用的库或技巧?PDF全部由TeX生成,应该有一些"正式"结构.

sch*_*der 14

您可以尝试使用pyPdf此示例.

例如:

from pyPdf import PdfFileWriter, PdfFileReader

def get_pdf_title(pdf_file_path):
    with open(pdf_file_path) as f:
        pdf_reader = PdfFileReader(f) 
        return pdf_reader.getDocumentInfo().title

title = get_pdf_title('/home/user/Desktop/my.pdf')
Run Code Online (Sandbox Code Playgroud)