将PDF转换为HTML

Tou*_*Pal 20 html php pdf pdf-to-html

将PDF文档转换为HTML格式的最佳解决方案是什么?该站点有几个PDF文档,访问者可以单击视图作为HTML,这应该在屏幕上以HTML文件的形式查看.

运行PHP,Linux,Apache的标准网站.

Ale*_*ier 6

pdftohtml工作正常:快速,稳定,但html结果充其量是丑陋的.我已经使用它一段时间了一个有很多工作简历的网站.

但是,它是提取文本内容的好方法.

我会试试scribd API

或谷歌应用程序文档API.GOogle在显示和转换pdf文件方面表现非常出色

  • 对于科学论文,这看起来令人难以置信:https://github.com/coolwanglu/pdf2htmlEX (4认同)