我正在创建一个Web界面,用来自数据库的用户数据自动填充pdf表单.管理员需要能够上传pdf(现在以IRS pdf格式为目标),然后将pdf中的字段与数据库中的数据字段相关联.
我需要一种方法来帮助管理员将字段名称(例如"topmostSubform [0] .Page2 [0] .p2-t66 [0]")与数据库中的数据字段相关联.我正在寻找一种以编程方式修改PDF以某种方式提供此信息的方法.
基本上,我愿意接受有关如何使字段名称在原始pdf的修改版本上以明显方式显示的建议.我最接近的是能够通过逐行编辑原始pdf将工具提示插入到pdf中的字段中.但是,当以这种方式编辑pdf时,字段名称是乱码,所以我不能只使用它们.
最佳解决方案是任何可以自动解析pdf并将每个字段的工具提示设置为字段名称的解决方案.任何可以从命令行或任何python工具运行的东西,或者只是从原始pdf文件中正确解析字段名称的基本内容都会令人惊讶.
可能有比这更简单的解决方案,但您绝对可以使用 http://www.reportlab.com/software/opensource/rl-toolkit/'>ReportLab 完成工作。
如果您可以将当前的税表另存为图像,则可以确定每个项目需要写入的位置并开发代码,以便它自动将数据库中的适当值分层到图像(税表或不管它是什么)。
一旦您确定了 1) 需要从数据库中提取哪些字段,以及 2) 它们应该在表单中的位置...
这本质上就是你要做的:
from reportlab.pdfgen import canvas
report_string_values = ['Alex',500,500],['Guido',400,400],
c = canvas.Canvas('hello.pdf')
c.drawImage(background_image,x_pos,y_pos) # x_pos and w_pos are # pixels from bl origin
for rsv in report_string_values:
c.drawString(rsv.x_pos,rsv.,rsv.text)
c.showPage()
c.save()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4117 次 |
| 最近记录: |