标签: docx

用于处理docx文档的Apache POI或docx4j

您认为哪个更好用于将docx文档作为java对象读取?为什么?

换一种说法.哪个库支持大多数单词标签?

java docx apache-poi docx4j

18
推荐指数
2
解决办法
3万
查看次数

使用libreoffice将HTML转换为DOCX时丢失上标标记

我有以下HTML:

<html><body><p>n<sup>th</sup></p></body></html>

我正在使用命令:

$ libreoffice --convert-to docx:"MS Word 2007 XML"test.html

将该HTML转换为DOCX文件.但是我注意到生成的DOCX文件实际上并不包含<sup>标记.看起来它使用位置和大小来复制<w:vertAlign>标记:

<w:position w:val="8"/><w:sz w:val="19"/>

我需要知道的是如何将libreoffice放入<w:vertAlign>标签而不是使用位置和大小.

添加信息:

我有粗体和斜体(类似的问题<strong><em>),但能得到转化为正确的工作,如果我转换strongem标签b,并i分别标记.

html converter docx libreoffice

18
推荐指数
1
解决办法
1636
查看次数

如何向 Pandoc 生成的 docx 文件添加自定义格式?

如何将自定义格式添加到Pandoc从 Markdown 生成的 docx 文件中?例如,我可以突出显示文本或将其居中吗?我可以重新设置链接样式吗?

我知道我可以通过使用--reference-doc(使用 生成)来更改默认元素(例如标题pandoc -o custom-reference.docx --print-default-data-file reference.docx)的样式,但我想引入其他样式。

docx pandoc

18
推荐指数
1
解决办法
1万
查看次数

如何替换模板docx文档和Open XML SDK 2.0(2009年8月)中的内容?

我有一个"模板"docx文档,其中包含所需的布局,并希望使用C#插入内容,但我找不到一种方法来唯一地处理文档的特定部分,如段落或表格.唯一标识文档中元素的最佳方法是什么?谢谢,Matt Sharpe.

c# docx openxml

17
推荐指数
1
解决办法
4万
查看次数

OpenXML 2 SDK - Word文档 - 以编程方式创建项目符号列表

使用OpenXML SDK,2.0 CTP,我试图以编程方式创建一个Word文档.在我的文档中,我必须插入项目符号列表,列表中的一些元素必须加下划线.我怎样才能做到这一点?

ms-word docx bulletedlist openxml

17
推荐指数
3
解决办法
1万
查看次数

使用Vim编辑Microsoft Word文件

我找到了ViEmu,一个用于微软词的vi模拟器.但是,我想用vim编辑DOC甚至rtf文件.这可能吗 ?

它们是否保留与Microsoft Word和Vim兼容的页面/段落布局的其他格式?我也对OpenOffice格式持开放态度.

vim rtf ms-word doc docx

17
推荐指数
2
解决办法
2万
查看次数

unoconv在尝试转换时不工作.抛出错误:无法连接或启动自己的侦听器.中止

我正在尝试将docx转换为pdf使用unoconv,但是Error: Unable to connect or start own listener. Aborting.当我运行时获取unoconv -f pdf 1234.docx.

所以,必须有一些倾听者.然后我开始通过听众unoconv --listener.
我试过了ps aux | grep soffice,发现了soffice.bin.

所以我又试了 unoconv -f pdf 1234.docx一次.它仍然给了我同样的错误: Error: Unable to connect or start own listener. Aborting.

我在这做错了什么?

openoffice.org docx file-conversion ms-office libreoffice

17
推荐指数
1
解决办法
1万
查看次数

使用PHP生成word文档

你知道用PHP和没有COM组件生成docdocx文件的任何方法吗?我试过PHPWord,它创建了docx文件,但是这些文件无法打开,OpenOffice因为它们会导致崩溃.我也尝试过PHPDocx,但它根本没有生成任何文件.

php ms-word doc docx phpdocx

16
推荐指数
3
解决办法
7万
查看次数

如何使用php将docx文档转换为html?

我希望能够上传MS Word文档并将其导出到我的网站中.

有没有办法实现这个目标?

html php docx

16
推荐指数
1
解决办法
3万
查看次数

使用纯python将docx转换为pdf(在linux上,没有libreoffice)

我正在处理一个试图开发网络应用程序的问题,其中一部分将上传的docx文件转换为pdf文件(经过一些处理后).使用python-docx和其他方法,我不需要安装word的Windows机器,甚至linux上的libreoffice,用于大多数处理(我的web服务器是pythonanywhere - linux但没有libreoffice,没有sudoapt install权限).但转换为pdf似乎需要其中之一.通过在这里和其他地方探索问题,这是我到目前为止:

import subprocess

try:
    from comtypes import client
except ImportError:
    client = None

def doc2pdf(doc):
    """
    convert a doc/docx document to pdf format
    :param doc: path to document
    """
    doc = os.path.abspath(doc) # bugfix - searching files in windows/system32
    if client is None:
        return doc2pdf_linux(doc)
    name, ext = os.path.splitext(doc)
    try:
        word = client.CreateObject('Word.Application')
        worddoc = word.Documents.Open(doc)
        worddoc.SaveAs(name + '.pdf', FileFormat=17)
    except Exception:
        raise
    finally:
        worddoc.Close()
        word.Quit()


def doc2pdf_linux(doc):
    """
    convert a …
Run Code Online (Sandbox Code Playgroud)

python pdf docx pythonanywhere python-docx

16
推荐指数
1
解决办法
9311
查看次数