有没有办法以编程方式从PDF文件中提取突出显示的文本和注释?欢迎任何语言.我找到了几个包含Python,Java和PHP的库,但是没有一个能够完成这项任务.
我不知道是否可能.我也知道有些程序会创建额外的文件来保存这类信息(如果我没有错,Kindle会生成另一个文件.)但目前这些文件超出了范围.
pdf information-retrieval
information-retrieval ×1
pdf ×1