哪些是将PDF文件转换为文本的最佳Python模块?
python pdf text-extraction pdf-scraping
我正在编写一个使用Cairo图形库输出PDF文件的CAD应用程序.许多单元测试不需要实际生成PDF文件,例如计算对象的预期边界框.但是,我想确保在更改代码后生成的PDF文件"看起来"正确.有没有自动化的方法来做到这一点?我怎样才能尽可能自动化?我是否需要目视检查每个生成的PDF?如何在不拔头发的情况下解决这个问题?
python pdf-generation unit-testing imagemagick cairo
python ×2
cairo ×1
imagemagick ×1
pdf ×1
pdf-generation ×1
pdf-scraping ×1
text-extraction ×1
unit-testing ×1