我想从pdf 文档中提取一个表
我尝试了pdf的路线 - > html - >提取表.转换为html时我上面提到的pdf产生垃圾,可能是因为字体,文件不是英文的.
因为这样的解决方案需要从URL上面提到的,这将有表,但不总是在相同的位置未来的PDF工作用x提取PDF和y坐标是不是一种选择.
请帮忙,
提前致谢.
python pdf pdf-parsing
pdf ×1
pdf-parsing ×1
python ×1