标签: pdf-reader

tables = camelot.read_pdf('test.pdf', pages='1-end', flavor='stream')
tables.export('foo.csv', f='csv', compress=False)

for table in tables:
    table_df = table.df
    # Code to parse data from tables in each element converted into datafram

Run Code Online (Sandbox Code Playgroud)

为什么camelot-py 会重复一些表？有什么办法可以处理这种重复吗？

更多信息：

输入 PDF 文件：由于敏感数据，我无法共享 pdf 文件。但这里有一些细节可以让您很好地了解其结构：所有页面仅包含表格。第 1 页：包含表 1，其中包含客户信息。表2至表4结构相同

第 2 页：包含表 4 和表 5 至 7 中的一些行，其结构与表 2 相同

第3页：表8至10，结构与表2相同

输出 CSV 文件：

foo-page-1-table-1：包含表 1

foo-page-1-table-2：包含表 1 和表 2 至 4 …

python pdf-parsing pdf-reader python-camelot

mk0*_*k09

2020 02-27

11
推荐指数

0
解决办法

1382
查看次数

使用python3显示PDF文件

我想写一个显示PDF文件的python3/PyGTK3应用程序,我无法找到允许我这样做的python包.
有pypoppler,但它看起来过时(？)并且似乎不支持python3(？)

你有什么建议吗？

编辑:注意,我不需要花哨的功能,如PDF格式,操纵或写作.

pygtk pdf-reader pygobject python-3.x pdf-rendering

Fab*_*nze

2015 11-09

10
推荐指数

1
解决办法

5381
查看次数

Python - ReportLab 和 PyPDF 编辑 PDF 问题

PyPDF我正在尝试使用和编辑现有的 pdf 文件ReportLab。当我尝试放置红色圆圈和红色文本时，它似乎隐藏在白色容器或其他东西后面。如果我把它放在其他地方，它就可以正常工作。是什么原因造成的？

样本 pdf = https://www.puc.nh.gov/regulatory/CASEFILE/2010/10-246/INITIAL%20FILING%20-%20PETITION/10-246%202010-09-13%20BAYRING%20ATT%20TO% 20PET%20FOR%20AUTH%20TO%20CONSTRUCT%20UTILITY%20CABLE%20OVER%20AND%20ACROSS%20SUNCOOK%20RIVER.PDF

WHAT THE ERROR IS:

WHAT THE FINAL RESULT SHOULD BE:

from PyPDF2 import PdfWriter, PdfReader
import io
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
from reportlab.lib.colors import red

def main():
    packet = io.BytesIO()
    can = canvas.Canvas(packet, pagesize=letter)
    can.setFillColorRGB(1, 0, 0)
    can.circle(370,780,20,fill=1)
    can.setFillColor(red)
    can.setFont("Times-Roman", 14)
    can.drawString(352, 785, "Customer Group #22")
    can.save()

    packet.seek(0)
    new_pdf = PdfReader(packet)

    existing_pdf = PdfReader(open("samplePDF.pdf", "rb"))
    output = PdfWriter()

    page = existing_pdf.pages[1]
    page.merge_page(new_pdf.pages[0])
    output.add_page(page)

    outputStream = …

Run Code Online (Sandbox Code Playgroud)

python reportlab pypdf pdf-reader

zac*_*987

2023 03-15

8
推荐指数

1
解决办法

850
查看次数

Itext 7 - PdfReader 未使用所有者密码打开错误

我正在使用最新 Itext7 的此示例来填写文档，但收到此错误： iText.Kernel.Crypto.BadPasswordException: PdfReader 未使用所有者密码打开所以我环顾网络，发现有些人找到了解决此错误的方法 PdfReader.unethicalreading = true;，但是当我尝试使用相同的代码时，它说 PDFReader 中没有名为 unethicalreading 的定义

这是我的代码：

 string src = @"C:\test1.pdf";
    string dest = @"C:\Test2.pdf";
    PdfDocument pdfDoc = new PdfDocument(new PdfReader(src), new PdfWriter(dest));
    PdfAcroForm form = PdfAcroForm.GetAcroForm(pdfDoc, true);
    IDictionary<String, PdfFormField> fields = form.GetFormFields();
    PdfFormField toSet;
    fields.TryGetValue("Name", out toSet);
    toSet.SetValue("Some text");

Run Code Online (Sandbox Code Playgroud)

c# asp.net pdf-generation pdf-reader itext7

Ahm*_*mad

lucky-day

7
推荐指数

1
解决办法

7924
查看次数