use*_*601 13 linux ms-word doc
我们正在搜索允许我们将doc或docx文档转换为txt文件的程序.我们正在使用linux,我们希望启动一个转换用户上传的doc文件的网站.我们不想使用开放式办公室/自由办公室因为我们有不好的经验.Pandoc无法处理doc文件:/
有人有想法吗?
har*_*ski 10
您必须使用两种不同的命令行工具,具体取决于您使用的是.doc还是.docx格式.
对于.doc使用catdoc:
catdoc foo.doc > foo.txt
Run Code Online (Sandbox Code Playgroud)
对于.docx,请使用docx2txt:
docx2txt foo.docx
Run Code Online (Sandbox Code Playgroud)
后者将在与原始目录相同的目录中生成一个名为foo.txt的文件.
我不确定您使用的是哪个Linux发行版,但是budoc和docx2txt都可以从Ubuntu存储库中获得,例如:
apt-get install docx2txt
Run Code Online (Sandbox Code Playgroud)
或者使用Mac上的Homebrew:
brew install docx2txt
Run Code Online (Sandbox Code Playgroud)