我正在申请要求打开pdf.
我在资产文件夹中也有一些pdf,所以我无法直接在webview中打开它.
默认情况下,android不支持pdf.
有没有适用于android的API(MuPdf除外)?
我的设备没有安装任何pdf阅读器,因此ACTION VIEW对我没用
以下不工作.......
你可以建议我任何好的api ...
提前致谢...
我知道这听起来很有野心,但是我们的客户需要一个自己的PDF阅读器和一些选定的功能.任何人都可以指导我一些好的教程,为开始这个开发铺平道路吗?
我想我需要清除一些pdf基础知识并从头开始或者我会很高兴,如果有任何我可以直接使用的库,只能按照我的意愿修改控件.
是否有与Google Chrome PDF Viewer,pdfium交互的API ?喜欢阅读当前页面的页码或设置当前页面(如Adobe#page=10
)或像PDFObject这样的支持库吗?
我正在尝试使用camelot-py v0.7.3 从多页PDF 文件中提取表格。
到目前为止,它对我来说是最好的 pdf 阅读器工具。我只需要逐行阅读 pdf 并手动检测表格。我尝试了许多其他工具,例如 tabula、PyPDF2/4、pdfminer 等。其中一些无法正确检测文本本身,其中一些扰乱了单词序列或列之间的间距。
但camelot-py 为我提供了最适合我的应用程序的格式的数据。
在使用camelot-py从pdf中提取数据的过程中,它几乎很好地检测了所有表的数据,除了很少的错误:
它将多个表分组到同一个“TableList”元素中。但我可以将这些分组的表分开。所以这里不需要担心。
这些分组表中的最后一个表在单独的“TableList”元素中重复。这种重复是我最关心的问题。
上述过程使用的代码如下:
tables = camelot.read_pdf('test.pdf', pages='1-end', flavor='stream')
tables.export('foo.csv', f='csv', compress=False)
for table in tables:
table_df = table.df
# Code to parse data from tables in each element converted into datafram
Run Code Online (Sandbox Code Playgroud)
为什么camelot-py 会重复一些表?有什么办法可以处理这种重复吗?
更多信息:
输入 PDF 文件:由于敏感数据,我无法共享 pdf 文件。但这里有一些细节可以让您很好地了解其结构: 所有页面仅包含表格。第 1 页:包含表 1,其中包含客户信息。表2至表4结构相同
第 2 页:包含表 4 和表 5 至 7 中的一些行,其结构与表 2 相同
第3页:表8至10,结构与表2相同
输出 CSV 文件:
foo-page-1-table-1:包含表 1
foo-page-1-table-2:包含表 1 和表 2 至 4 …
我想写一个显示PDF文件的python3/PyGTK3应用程序,我无法找到允许我这样做的python包.
有pypoppler,但它看起来过时(?)并且似乎不支持python3(?)
你有什么建议吗?
编辑:注意,我不需要花哨的功能,如PDF格式,操纵或写作.
PyPDF
我正在尝试使用和编辑现有的 pdf 文件ReportLab
。当我尝试放置红色圆圈和红色文本时,它似乎隐藏在白色容器或其他东西后面。如果我把它放在其他地方,它就可以正常工作。是什么原因造成的?
WHAT THE ERROR IS:
WHAT THE FINAL RESULT SHOULD BE:
from PyPDF2 import PdfWriter, PdfReader
import io
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
from reportlab.lib.colors import red
def main():
packet = io.BytesIO()
can = canvas.Canvas(packet, pagesize=letter)
can.setFillColorRGB(1, 0, 0)
can.circle(370,780,20,fill=1)
can.setFillColor(red)
can.setFont("Times-Roman", 14)
can.drawString(352, 785, "Customer Group #22")
can.save()
packet.seek(0)
new_pdf = PdfReader(packet)
existing_pdf = PdfReader(open("samplePDF.pdf", "rb"))
output = PdfWriter()
page = existing_pdf.pages[1]
page.merge_page(new_pdf.pages[0])
output.add_page(page)
outputStream = …
Run Code Online (Sandbox Code Playgroud) 我正在使用最新 Itext7 的此示例来填写文档,但收到此错误: iText.Kernel.Crypto.BadPasswordException: PdfReader 未使用所有者密码打开
所以我环顾网络,发现有些人找到了解决此错误的方法
PdfReader.unethicalreading = true;
,但是当我尝试使用相同的代码时,它说 PDFReader 中没有名为 unethicalreading 的定义
这是我的代码:
string src = @"C:\test1.pdf";
string dest = @"C:\Test2.pdf";
PdfDocument pdfDoc = new PdfDocument(new PdfReader(src), new PdfWriter(dest));
PdfAcroForm form = PdfAcroForm.GetAcroForm(pdfDoc, true);
IDictionary<String, PdfFormField> fields = form.GetFormFields();
PdfFormField toSet;
fields.TryGetValue("Name", out toSet);
toSet.SetValue("Some text");
Run Code Online (Sandbox Code Playgroud) 当我安装react-pdf时,出现以下错误:
ModuleNotFoundError: Module not found: Error: Can't resolve 'canvas' in '/home/pegasus/Documents/Final_Website/blog/node_modules/pdfjs-dist/build'
我正在尝试在盖茨比网站上呈现 pdf。但为此我需要react-pdf并且它抛出了这个错误。
我正在使用'pdf-reader'gem来阅读pdf文档的原始内容,以便我可以将它们发布(http-post)到API.要确认API实现可以从原始内容创建有效的pdf文档,我写了一个小小的要点来验证我的代码以阅读pdf内容.
出于某种原因,我总是得到'PDF不包含EOF标记(PDF :: Reader :: MalformedPDFError)'.
谁能指出我哪里出错了?
pdf-reader ×10
pdf ×3
android ×2
python ×2
asp.net ×1
c# ×1
canvas ×1
gatsby ×1
gem ×1
ios ×1
itext7 ×1
javascript ×1
objective-c ×1
pdf-parsing ×1
pygobject ×1
pygtk ×1
pypdf ×1
python-3.x ×1
react-pdf ×1
reactjs ×1
reportlab ×1
ruby ×1
stringio ×1