相关疑难解决方法(0)

使用python查找搜索字符串在pdf文档中的哪个页面

我可以使用哪些python包来找出特定"搜索字符串"所在的页面?

我查看了几个python pdf包但无法弄清楚应该使用哪一个. PyPDF似乎没有这个功能,而PDFMiner似乎对这样简单的任务来说过分了.有什么建议?

更精确:我有几个PDF文档,我想提取字符串"Begin"和字符串"End"之间的页面.

python pdf pypdf

5
推荐指数
2
解决办法
6605
查看次数

在python中使用win32com.client如何查找和替换多个文本

我正在尝试使用find并使用win32com.client Python库替换为Word文档添加多个字符串值.

我可以找到并替换一个值,但我不知道如何为多个值执行此操作.

这是我到目前为止:

import win32com.client
word = win32com.client.DispatchEx("Word.Application")
word.Visible = True
word.DisplayAlerts = 0
word.Documents.Open("C:\TEMP\Testing\Me.docx")
word.Selection.Find
find.Text = "First Name"
find.Replacement.Text = "John"
find.Execute(Replace=1, Forward=True)

# the following part doesn't run
find.Text = "Last Name"             
find.Replacement.Text = "Smith"
find.Execute(Replace=1, Forward=True)

word.ActiveDocument.SaveAs('C:\TEMP\Testing\Me2.docx')
word.Quit() # releases Word object from memory
Run Code Online (Sandbox Code Playgroud)

有什么建议?

python ms-word

5
推荐指数
1
解决办法
1万
查看次数

Python:使用python-docx/lxml创建"目录"

我试图在python-docx(https://github.com/mikemaccana/python-docx)的帮助下自动创建.docx文件(WordML ).我当前的脚本使用以下循环手动创建ToC:

for chapter in myChapters:
    body.append(paragraph(chapter.text, style='ListNumber'))
Run Code Online (Sandbox Code Playgroud)

有没有人知道使用"内置单词"ToC功能的方法,它会自动添加索引并创建各个章节的段落链接?

非常感谢!

python docx wordml python-docx

5
推荐指数
4
解决办法
8028
查看次数

使用 Python 编写的 word 文档的页数

有没有办法用 Python 有效地获取 word 文档(.doc、.docx)的页数?

对于 .odt 文件?

我想将它用于 Linux 上基于 Web2py 的 Web 应用程序。

谢谢 !

python doc docx odt

3
推荐指数
2
解决办法
7061
查看次数

标签 统计

python ×4

docx ×2

doc ×1

ms-word ×1

odt ×1

pdf ×1

pypdf ×1

python-docx ×1

wordml ×1