Mil*_*ike 5 linux openoffice libreoffice
我正在尝试将 html 转换为 doc 或 docx。我使用了一些可用的 php 类,但结果并不好。我想知道是否可以使用某些办公软件(如 LibreOffice 或 OpenOffice)将 html 文件转换为 doc?
LibreOffice (AbiWord) 将 html“转换”为 doc 文件,但没有格式化。我的意思是当我打开 doc 文件时我会看到 html 源代码。
abiword --plugin AbiCommand
convert /home/qqq/test/test.htm /home/qqq/test/test.doc doc
Run Code Online (Sandbox Code Playgroud)
使用 openOffice,没有任何反应..:
soffice --headless --convert-to doc:DOC /home/qqq/test/test.htm
Run Code Online (Sandbox Code Playgroud)
我必须按 ctrl+c 才能返回控制台。
任何想法如何将 html 转换为 doc?我可以在这两个应用程序的桌面版本中打开 html 并另存为 doc 但在控制台版本中似乎不起作用。
这是一个很晚的回复,但我希望它对一些人有帮助。
LibreOffice 使用过滤器
在下面的代码示例中(例如,将 HTML 转换为 PDF),您会注意到辅助可选参数,例如 --infilter=writerglobal8_HTML 和 :writer_web_pdf_Export:
soffice --headless --infilter=writerglobal8_HTML --convert-to pdf:writer_web_pdf_Export --outdir /SomeFolder/Output /SomeFolder/Example.html
Run Code Online (Sandbox Code Playgroud)
这些被称为“过滤器”。它相当于单个文件类型的子类别。例如,.doc 可以是 Microsoft Office 95 文档或 2003 文档。它基本上为 LibreOffice 提供了有关文件格式的线索。
有两种类型的过滤器,一个 in 过滤器(基本上是“传入文件是什么子格式”)和一个 out 过滤器(传出、IE 导出、文件输入是什么格式)。
在您的情况下,有效的 DOC 过滤器包括(其中包含空格,您可能需要使用引号,但我经常发现引号不起作用,因此您的情况可能会有所不同):
MS WinWord 5
MS WinWord 6.0
MS Word 2003 XML
MS Word 2007 XML
MS Word 2007 XML Template
MS Word 2007 XML VBA
MS Word 95
MS Word 95 Vorlage
MS Word 97
MS Word 97 Vorlage
MS_Works
MS_Write
Run Code Online (Sandbox Code Playgroud)
您可以从此处找到的 LibreOffice 提供的(有些混乱的).ODS 表中找出一些文件过滤器。
归档时间: |
|
查看次数: |
9344 次 |
最近记录: |