Luc*_*ore 20 html pdf file-conversion
是否有适当的库可用于将PDF转换为HTML或其他可轻松转换为HTML的格式?
我搜索了类似的问题,但没有运气.
我希望能够从PDF中提取文本,可能是图像.我不打算将PDF嵌入HTML中.
如果您使用的是Linux,请尝试pdftohtml:
sudo apt-get install poppler-utils
pdftohtml -enc UTF-8 -noframes infile.pdf outfile.html
Run Code Online (Sandbox Code Playgroud)
开源电子书转换器Calibre还可以将PDF文件转换为HTML,并且可以在MacOS,Windows和Linux上使用。