标签: pdf-reader

如何在我的Android应用程序中阅读pdf?

我正在申请要求打开pdf.

我在资产文件夹中也有一些pdf,所以我无法直接在webview中打开它.

默认情况下,android不支持pdf.

有没有适用于android的API(MuPdf除外)?

我的设备没有安装任何pdf阅读器,因此ACTION VIEW对我没用

以下不工作.......

在Android上使用Java渲染PDF文件

在应用程序中打开资产文件pdf

你可以建议我任何好的api ...

提前致谢...

android pdf-reader

48
推荐指数
2
解决办法
8万
查看次数

24
推荐指数
3
解决办法
4万
查看次数

从头开始的Android PDF阅读器

我知道这听起来很有野心,但是我们的客户需要一个自己的PDF阅读器和一些选定的功能.任何人都可以指导我一些好的教程,为开始这个开发铺平道路吗?

我想我需要清除一些pdf基础知识并从头开始或者我会很高兴,如果有任何我可以直接使用的库,只能按照我的意愿修改控件.

pdf android pdf-reader

18
推荐指数
1
解决办法
1万
查看次数

Google Chrome PDF Viewer API?

是否有与Google Chrome PDF Viewer,pdfium交互的API ?喜欢阅读当前页面的页码或设置当前页面(如Adobe#page=10)或像PDFObject这样的支持库吗?

javascript google-chrome pdf-reader

13
推荐指数
2
解决办法
1万
查看次数

Camelot-py 从 pdf 中提取同一个表两次

我正在尝试使用camelot-py v0.7.3 从多页PDF 文件中提取表格。

到目前为止,它对我来说是最好的 pdf 阅读器工具。我只需要逐行阅读 pdf 并手动检测表格。我尝试了许多其他工具,例如 tabula、PyPDF2/4、pdfminer 等。其中一些无法正确检测文本本身,其中一些扰乱了单词序列或列之间的间距。

但camelot-py 为我提供了最适合我的应用程序的格式的数据。

在使用camelot-py从pdf中提取数据的过程中,它几乎很好地检测了所有表的数据,除了很少的错误:

  1. 它将多个表分组到同一个“TableList”元素中。但我可以将这些分组的表分开。所以这里不需要担心。

  2. 这些分组表中的最后一个表在单独的“TableList”元素中重复。这种重复是我最关心的问题。

上述过程使用的代码如下:

tables = camelot.read_pdf('test.pdf', pages='1-end', flavor='stream')
tables.export('foo.csv', f='csv', compress=False)

for table in tables:
    table_df = table.df
    # Code to parse data from tables in each element converted into datafram
Run Code Online (Sandbox Code Playgroud)

为什么camelot-py 会重复一些表?有什么办法可以处理这种重复吗?

更多信息:

输入 PDF 文件:由于敏感数据,我无法共享 pdf 文件。但这里有一些细节可以让您很好地了解其结构: 所有页面仅包含表格。第 1 页:包含表 1,其中包含客户信息。表2至表4结构相同

第 2 页:包含表 4 和表 5 至 7 中的一些行,其结构与表 2 相同

第3页:表8至10,结构与表2相同

输出 CSV 文件:

foo-page-1-table-1:包含表 1

foo-page-1-table-2:包含表 1 和表 2 至 4 …

python pdf-parsing pdf-reader python-camelot

11
推荐指数
0
解决办法
1382
查看次数

使用python3显示PDF文件

我想写一个显示PDF文件的python3/PyGTK3应用程序,我无法找到允许我这样做的python包.
pypoppler,但它看起来过时(?)并且似乎不支持python3(?)

你有什么建议吗?

编辑:注意,我不需要花哨的功能,如PDF格式,操纵或写作.

pygtk pdf-reader pygobject python-3.x pdf-rendering

10
推荐指数
1
解决办法
5381
查看次数

Python - ReportLab 和 PyPDF 编辑 PDF 问题

PyPDF我正在尝试使用和编辑现有的 pdf 文件ReportLab。当我尝试放置红色圆圈和红色文本时,它似乎隐藏在白色容器或其他东西后面。如果我把它放在其他地方,它就可以正常工作。是什么原因造成的?

样本 pdf = https://www.puc.nh.gov/regulatory/CASEFILE/2010/10-246/INITIAL%20FILING%20-%20PETITION/10-246%202010-09-13%20BAYRING%20ATT%20TO% 20PET%20FOR%20AUTH%20TO%20CONSTRUCT%20UTILITY%20CABLE%20OVER%20AND%20ACROSS%20SUNCOOK%20RIVER.PDF

WHAT THE ERROR IS:

WHAT THE FINAL RESULT SHOULD BE:

from PyPDF2 import PdfWriter, PdfReader
import io
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
from reportlab.lib.colors import red

def main():
    packet = io.BytesIO()
    can = canvas.Canvas(packet, pagesize=letter)
    can.setFillColorRGB(1, 0, 0)
    can.circle(370,780,20,fill=1)
    can.setFillColor(red)
    can.setFont("Times-Roman", 14)
    can.drawString(352, 785, "Customer Group #22")
    can.save()

    packet.seek(0)
    new_pdf = PdfReader(packet)

    existing_pdf = PdfReader(open("samplePDF.pdf", "rb"))
    output = PdfWriter()

    page = existing_pdf.pages[1]
    page.merge_page(new_pdf.pages[0])
    output.add_page(page)

    outputStream = …
Run Code Online (Sandbox Code Playgroud)

python reportlab pypdf pdf-reader

8
推荐指数
1
解决办法
850
查看次数

Itext 7 - PdfReader 未使用所有者密码打开错误

我正在使用最新 Itext7 的此示例来填写文档,但收到此错误: iText.Kernel.Crypto.BadPasswordException: PdfReader 未使用所有者密码打开 在此输入图像描述 所以我环顾网络,发现有些人找到了解决此错误的方法 PdfReader.unethicalreading = true;,但是当我尝试使用相同的代码时,它说 PDFReader 中没有名为 unethicalreading 的定义

这是我的代码:

 string src = @"C:\test1.pdf";
    string dest = @"C:\Test2.pdf";
    PdfDocument pdfDoc = new PdfDocument(new PdfReader(src), new PdfWriter(dest));
    PdfAcroForm form = PdfAcroForm.GetAcroForm(pdfDoc, true);
    IDictionary<String, PdfFormField> fields = form.GetFormFields();
    PdfFormField toSet;
    fields.TryGetValue("Name", out toSet);
    toSet.SetValue("Some text");
Run Code Online (Sandbox Code Playgroud)

c# asp.net pdf-generation pdf-reader itext7

7
推荐指数
1
解决办法
7924
查看次数

ModuleNotFoundError:找不到模块:错误:无法解析“/home/pegasus/Documents/Final_Website/blog/node_modules/pdfjs-dist/build”中的“canvas”

当我安装react-pdf时,出现以下错误:

ModuleNotFoundError: Module not found: Error: Can't resolve 'canvas' in '/home/pegasus/Documents/Final_Website/blog/node_modules/pdfjs-dist/build'

我正在尝试在盖茨比网站上呈现 pdf。但为此我需要react-pdf并且它抛出了这个错误。

canvas pdf-reader reactjs gatsby react-pdf

7
推荐指数
1
解决办法
1957
查看次数

PDF不包含带有pdf-reader的EOF标记(PDF :: Reader :: MalformedPDFError)

我正在使用'pdf-reader'gem来阅读pdf文档的原始内容,以便我可以将它们发布(http-post)到API.要确认API实现可以从原始内容创建有效的pdf文档,我写了一个小小的要点来验证我的代码以阅读pdf内容.

出于某种原因,我总是得到'PDF不包含EOF标记(PDF :: Reader :: MalformedPDFError)'.

谁能指出我哪里出错了?

ruby pdf gem pdf-reader stringio

5
推荐指数
0
解决办法
950
查看次数