我应该使用哪个 CLI 应用程序将 Word 模板(*.dot 文件)转换为纯文本?

N0r*_*ert 7 command-line libreoffice microsoft-word

我有几个 Microsoft Word 模板文件。他们有*.dot扩展名:

$ file file.dot
file.dot: Composite Document File V2 Document, Little Endian, Os: Windows, 
Version 6.1, Code page: 1252, Author: user, Template: file.dot, Last Saved By: 
user, Revision Number: 2, Name of Creating Application: Microsoft Office Word, 
Total Editing Time: 01:00, Last Printed: Tue Nov 21 14:41:00 1995, Create
Time/Date: Fri Dec 20 11:46:00 2019, Last Saved Time/Date: Fri Dec 20 11:46:00 
2019, Number of Pages: 3, Number of Words: 300, Number of Characters: 1713,
Security: 0
Run Code Online (Sandbox Code Playgroud)

我需要使用一些 CLI 应用程序将它们转换为纯文本。

是否可以?

Sam*_*Sam 16

您可以在终端中使用 LibreOffice。

soffice --headless --convert-to txt:Text YOUR-DOCUMENT-HERE.DOT
Run Code Online (Sandbox Code Playgroud)

查看来源
Source1
Source2

  • 除了 Libreoffice 和 OpenOffice 之外,没有其他应用程序可以在 Ubuntu 上读取 `dot` 文件。所以我认为没有其他选择。也许一个可能是在 wine 中使用 MS Office。 (5认同)

Sim*_*ter 7

还有antiword(使用deb-package),它以一种非常有效但并不总是完全正确的方式从旧的(XML 之前的)Word 文档中提取纯文本。