使用 python-docx 将 HTML 转换为 Word 文档?

Kai*_*ili 1 html python python-2.7 python-docx

我想从 HTML 字段(可以写入文本并设置粗体、斜体、字体颜色大小等的字段)生成 Word 文档。我用这个Python-docx来生成WOrd文档。一切都好(添加图片,文本,..)唯一的问题是样式。问题是我的word文档中有内容但没有样式。

我尝试将内容保存为 HTML 文件,然后创建一个 python-docx 文件,如下所示:

html_f=open('f_html.html','w') 
html_f.write(u''+contenu) 
html_f.close() 


doc2=docx.Document('f_html.docx')
Run Code Online (Sandbox Code Playgroud)

但我没有结果,Document() 也没有找到该文件。请提供任何帮助

小智 5

Python-docx 仅接受纯文本。您可以使用Windows 的pywin32扩展来转换 html 文件。我发现一个简单的例子:

import win32com.client

word = win32com.client.Dispatch('Word.Application')
doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()
word.Quit() 
Run Code Online (Sandbox Code Playgroud)