我一直在尝试将doc/docx文件转换为html,我发现最好的选择是docx4j.任何人都可以帮我直接命令行来完成这项工作.
我试过了:
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
Run Code Online (Sandbox Code Playgroud)
作为回应,我希望HTML输出(无论是控制台还是文件).
看着http://dev.plutext.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.html和样本目录,我会认为
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
Run Code Online (Sandbox Code Playgroud)
应该管用.从" 入门" >" 命令行示例"部分中注意以下内容:
如果docx中有任何图像,您还需要:
Run Code Online (Sandbox Code Playgroud)xmlgraphics-commons-1.4.jar commons-logging-1.1.1.jar在你的类路径上.