标签: python-docx

python-docx - 如何重启列表刻字

我正在使用python-docx模块自动创建Word文档的过程.特别是,我正在创建一个多选项测试,其中问题编号为1,2,3.,......并且在每个问题下有4个答案应标记为A.,B.,C.和D.我用一种风格来创建编号列表和字母列表.但是,我不知道如何重启这些字母.例如,第二个问题的答案范围是E.,F.,G.,H.有谁知道如何将字母重新启动回A？我可以手动指定答案字符串中的字母,但我想知道如何使用样式表.谢谢.

python python-docx

bra*_*d14

lucky-day

7
推荐指数

2
解决办法

3461
查看次数

使用python docx组合word文档

我有几个单词文件,每个文件都有特定的内容.我想要一个片段向我展示或帮助我弄清楚如何将word文件合并到一个文件中,同时使用Python docx库.

例如,在pywin32库中,我执行了以下操作:

rng = self.doc.Range(0, 0)
for d in data:
    time.sleep(0.05)

    docstart = d.wordDoc.Content.Start
    self.word.Visible = True
    docend = d.wordDoc.Content.End - 1
    location = d.wordDoc.Range(docstart, docend).Copy()
    rng.Paste()
    rng.Collapse(0)
    rng.InsertBreak(win32.constants.wdPageBreak)

Run Code Online (Sandbox Code Playgroud)

但我需要在使用Python docx库而不是win32.client

python python-2.7 python-docx

omr*_*don

2016 09-26

7
推荐指数

4
解决办法

1万
查看次数

python-docx插入点

我不确定我是否遗漏了任何明显的东西,但是我没有找到任何关于如何在文档中的某个特定位置插入Word元素(例如表格)的文档？

我使用以下方法加载现有的MS Word .docx文档:

my_document = Document('some/path/to/my/document.docx')

Run Code Online (Sandbox Code Playgroud)

我的用例是获取文档中书签或部分的"位置",然后继续在该点下面插入表格.

我正在考虑一个允许我按照这些方式做某事的API:

insertion_point = my_document.bookmarks['bookmark_name'].position
my_document.add_table(rows=10, cols=3, position=insertion_point+1)

Run Code Online (Sandbox Code Playgroud)

我看到有计划实现类似于MS Word API的'range'对象的东西,这将有效地解决这个问题.在此期间,有没有办法指示document对象方法在哪里插入新元素？

也许我可以粘贴一些lxml代码来查找节点并将其传递给这些python-docx方法？任何关于这个主题的帮助将不胜感激!谢谢.

cursor-position insertion python-3.x python-docx

Apt*_*ryx

lucky-day

7
推荐指数

1
解决办法

7335
查看次数

python-docx:'找不到包'

我在'/ var/code/oa'有一个doc.docx文件.我需要用python-docx读它.我写这个:

from docx import Document
document = Document('/var/code/oa/doc.docx')

Run Code Online (Sandbox Code Playgroud)

然后,有错误.. PackageNotFoundError:在'/var/code/oa/doc.docx'找不到包

为什么？

谢谢@soon.呃,这很愚蠢.原因是文件,它必须是docx文件.我只是将文件名更改doc为docx,它不是真正的docx文件.

python python-docx

dsp*_*ebe

2014 09-03

7
推荐指数

1
解决办法

6668
查看次数

从.docx文件解析表

我想使用Python和python-docx将.docx文件中的表解析成一些有用的数据结构.

在我的例子中,.docx文件只包含一个表.我上传了它,所以你可以看看.这是一个截图:

Books.docx

python xml parsing docx python-docx

Sre*_*har

2015 01-09

7
推荐指数

1
解决办法

1万
查看次数

在文档中的页面上查找单词

我正在寻找一个优雅的解决方案,以找到文档中的哪个页面出现我存储在python词典/列表中的某个单词.

我首先将.docx格式视为输入,并查看了具有搜索功能的PythonDocx,但显然没有docx/xml格式的页面属性.如果我解析文档,我可以<w:br w:type="page"/>在xml树中查找出现但不幸的是,这些不显示非强制分页符.

我甚至考虑首先将文件转换为PDF并使用类似PDFminer的内容来逐页解析文档.

是否有任何直接的解决方案来搜索.docx文档中的字符串并返回它发生的页面

[('foo' ,[1, 4, 7 ]), ('bar', [2]), ('baz', [2, 5, 8, 9 )]

Run Code Online (Sandbox Code Playgroud)

python python-docx pdfminer

bir*_*git

2016 01-23

7
推荐指数

1
解决办法

1283
查看次数

在python docx中创建一个表并加粗文本

doc=Document()
table = doc.add_table(rows = 13, cols = 5)
table.style = 'Table Grid'
row = table.rows[0]
row.cells[0].text = ('text').bold

Run Code Online (Sandbox Code Playgroud)

我正在尝试创建一个表格并加粗文本,但无法正确获得语法

python-docx

Ker*_*Lee

lucky-day

7
推荐指数

1
解决办法

8410
查看次数

python -docx从word docx中提取表

我知道这是一个重复的问题,但这些答案对我不起作用.我有一个word文件,它包含一个表,现在我希望该表作为我的python程序的输出.我正在使用python 3.6,我也安装了python -docx.这是我的数据提取代码

from docx.api import Document

document = Document('test_word.docx')
table = document.tables[0]

data = []

keys = None
for i, row in enumerate(table.rows):
    text = (cell.text for cell in row.cells)

    if i == 0:
        keys = tuple(text)
        continue
    row_data = dict(zip(keys, text))
    data.append(row_data)
    print (data)

Run Code Online (Sandbox Code Playgroud)

我希望结果在docx文件中看起来完全正确.提前致谢

python python-3.x python-docx

Aro*_*oon

lucky-day

7
推荐指数

1
解决办法

7643
查看次数