是否可以使用perl读取pdf文件中的文本?

Hic*_*ick 3 perl

我想解析perl中的pdf文件中的文本而不将pdf转换为任何其他格式.可能吗 ?

Byr*_*ock 8

是的你可以.

看一下CAM :: PDF包.

您可以使用此模块将文本拉出.

 my $pdf = CAM::PDF->new($filename);
 my $pageone_tree = $pdf->getPageContentTree(1);
 print CAM::PDF::PageText->render($pageone_tree);
Run Code Online (Sandbox Code Playgroud)