Haskell:解析PDF

art*_*ave 10 pdf haskell

我需要的是阅读pdf,进行一些转换(生成TOC书签)并将其写回.

我发现这个http://hackage.haskell.org/package/HPDF,但它只提到生成pdf,而不是解析(尽管我可能错过了它)

Haskell纯粹是为了(自我)教育目的而选择的.

Don*_*art 5

有一些用于PDF操作的工具,尽管它们似乎偏向于生成而不是解析:

Pandoc是一个很棒的跨标记库,但是不支持PDF解析(它支持多种格式的PDF生成)。

还有:

我不确定我们是否有一个好的解析工具。


ja.*_*ja. 2

这是与 xpdf 部分的 haskell 绑定: http://hackage.haskell.org/package/pdf2line