有趣的问题,现在我也想研究一下:)
我记得有一些模块可以从 PDF 和 HTML 中将表提取为 Pandas Dataframe。 链接 我不确定它是否适用于 png.,jpeg 文件。
还可以找到一个 github 代码,用于: 使用 pytesseract 和 open cv 将图像中的表格转换为 excel 文件的表格检测、单元格识别和文本提取算法。 关联
用于通过图像获取数据的 Microsoft Excel 工具
| 归档时间: |
|
| 查看次数: |
4662 次 |
| 最近记录: |