相关疑难解决方法(0)

如何在Python中填写PDF表单?

如何用数据表单填充 PDF 文件并将其“压平”?

我现在使用 pdftk,但它不能正确处理国家字符。

是否有任何 Python 库或示例如何填写 PDF 表单并将其呈现为不可编辑的 PDF 文件?

python forms pdf fill

18
推荐指数
3
解决办法
4万
查看次数

从python或bash批量填写PDF表单

我有一个PDF表单,需要多次填写(确切地说是一个时间表).现在,因为我不想手动执行此操作,所以我正在寻找一种方法来使用python脚本或可以在bash脚本中使用的工具来填充它们.

有任何人对此有经验吗?

python forms pdf automation

12
推荐指数
2
解决办法
1万
查看次数

PDF表格字段操作

我正在创建一个Web界面,用来自数据库的用户数据自动填充pdf表单.管理员需要能够上传pdf(现在​​以IRS pdf格式为目标),然后将pdf中的字段与数据库中的数据字段相关联.

我需要一种方法来帮助管理员将字段名称(例如"topmostSubform [0] .Page2 [0] .p2-t66 [0]")与数据库中的数据字段相关联.我正在寻找一种以编程方式修改PDF以某种方式提供此信息的方法.

基本上,我愿意接受有关如何使字段名称在原始pdf的修改版本上以明显方式显示的建议.我最接近的是能够通过逐行编辑原始pdf将工具提示插入到pdf中的字段中.但是,当以这种方式编辑pdf时,字段名称是乱码,所以我不能只使用它们.

最佳解决方案是任何可以自动解析pdf并将每个字段的工具提示设置为字段名称的解决方案.任何可以从命令行或任何python工具运行的东西,或者只是从原始pdf文件中正确解析字段名称的基本内容都会令人惊讶.

python pdf django

9
推荐指数
1
解决办法
4117
查看次数

如何在wsgi中启动pdftk子进程?

我需要在Django中提供Web请求时启动pdftk进程,并等待它完成.我目前的pdftk代码如下所示:

proc = subprocess.Popen(["/usr/bin/pdftk", 
                         "/tmp/infile1.pdf", 
                         "/tmp/infile2.pdf", 
                         "cat", "output", "/tmp/outfile.pdf"])    
proc.communicate()
Run Code Online (Sandbox Code Playgroud)

只要我在开发服务器(以用户身份运行www-data)下执行,这样就可以正常工作.但是一旦我切换到mod_wsgi,不改变其他任何东西,代码挂起proc.communicate(),并且"outfile.pdf"保留为零长度的打开文件句柄.

我已经尝试了几个子进程调用的变种(以及普通的旧的os.system) - 将stdin/stdout/stderr设置为PIPE或各种文件句柄没有任何改变.使用"shell = True"可以防止proc.communicate()挂起,但是pdftk无法在devserver或mod_wsgi下创建输出文件. 这个讨论似乎表明可能存在一些更深层次的巫术信号和我不理解的pdftk.

是否有任何变通方法可以让这样的子进程调用在wsgi下正常工作?我正在避免使用PyPDF来组合pdf文件,因为我必须组合足够大量的文件(数百个),这些文件耗尽了内存(PyPDF需要在组合它们时保持每个源pdf文件在内存中打开).

我在最近的Ubuntu,pythons 2.6和2.7下做这个.

python django subprocess mod-wsgi pdftk

8
推荐指数
1
解决办法
1528
查看次数

将HTML表单提交为PDF

我们有一个高分辨率PDF(用于打印),其上有一些表格字段.我们希望有一个提交到PDF的HTML表单,然后将其放入相应的字段中.

我在谷歌找到了一个解决方案:http://koivi.com/fill-pdf-form-fields/

但是,使用该解决方案,您只能获得一个FDF文件......并且该演示对我不起作用,打开FDF文件只需下载另一个FDF文件.

由于此PDF将向公众开放,我们希望尽可能简单.如果我们必须打开原始PDF并导入这个FDF文件,我们需要一个不同的解决方案(我不确定FDF文件的用途,因为它不起作用).

一篇关于.net框架的相关帖子也有同样的想法,但只有付费商业解决方案:从HTML表格到PDF

到目前为止我找到的PHP解决方案是用于创建一个新的PDF,这不是我需要的.我们的PDF是使用Adobe Illustrator(或类似的adobe产品)创建的,并且具有嵌入字体,svg和图像内容的高分辨率.

表单元素到位,我们只需要将数据存入其中.

html php forms pdf

6
推荐指数
1
解决办法
2万
查看次数

在PDF文档中找到可输入表格字段的字段名称吗?

在PDF文档中找到可输入表格字段的字段名称吗?我有一个可编辑的PDF表单,试图将表单字段的输入自动化为使用python。

为此,我必须知道要输入的FDF数据中表单字段的“名称”。

请参阅背景问题:如何在Django / Python中自动填充PDF表单?

我不一定需要从PDF中找到程序名称,只要在Preview / Adob​​e / etc中可以知道它们的名称即可。足够的PDF阅读器/编辑器。

python pdf pdf-generation fpdf

3
推荐指数
1
解决办法
5091
查看次数

如何使用 Python 填写 PDF 表单

我有一个PDF form使用Adobe LiveCycle Designer ES 10.4. 我需要使用它来填充它,Python以便我们可以减少体力劳动。我在网上搜索并阅读了一些文章,其中大部分文章都集中在pdfrw图书馆,我尝试使用它并从中提取了一些信息PDF form如下所示

代码

from pdfrw import PdfReader
pdf = PdfReader('sample.pdf')
print(pdf.keys())
print(pdf.Info)
print(pdf.Root.keys())
print('PDF has {} pages'.format(len(pdf.pages)))
Run Code Online (Sandbox Code Playgroud)

输出

['/Root', '/Info', '/ID', '/Size']
{'/CreationDate': "(D:20180822164509+05'30')", '/Creator': '(Adobe LiveCycle Designer ES 10.4)', '/ModDate': "(D:20180822165611+05'30')", '/Producer': '(Adobe XML Form Module Library)'}
['/AcroForm', '/MarkInfo', '/Metadata', '/Names', '/NeedsRendering', '/Pages', '/Perms', '/StructTreeRoot', '/Type']
PDF has 1 pages
Run Code Online (Sandbox Code Playgroud)

我不确定如何进一步pdfrw访问 PDF 表单中的可填写字段并使用它们填写Python是否可能。任何的意见都将会有帮助。

python pdf adobe pdf-form pdfrw

2
推荐指数
2
解决办法
9826
查看次数

标签 统计

pdf ×6

python ×6

forms ×3

django ×2

adobe ×1

automation ×1

fill ×1

fpdf ×1

html ×1

mod-wsgi ×1

pdf-form ×1

pdf-generation ×1

pdfrw ×1

pdftk ×1

php ×1

subprocess ×1