Wak*_*nka 7 pdf fonts extract font-size
是否可以从 PDF 文件中提取有关特定字体/字体大小/字体颜色等的文本?我更喜欢 Perl、python 或 *nix 命令行实用程序。我的目标是从 PDF 文件中提取所有标题,这样我就可以在单个 PDF 中获得一个很好的文章索引。
use*_*289 3
文本和/font/字体大小/位置(没有颜色,正如我检查的),您可以从 Ghostscript 的 txtwrite 设备(尝试 -dTextFormat=0 | 1 选项)获取,也可以从 mudraw 的 (MuPDF) 和 -tt 选项获取。然后使用 Perl 等解析类似 XML 的输出。
归档时间:
12 年 前
查看次数:
7887 次
最近记录:
3 年,6 月 前