Java - 将doc/docx文件转换为chm文件

Ava*_*i Y 6 java chm doc docx

我有一个想法将Word文档(.doc/.docx)文件转换为帮助文件(.chm)格式.我想用Java来转换文件.我的公式很简单.要在Word文档中创建目录页面和其他链接,作为包浏览器或文件浏览器,使用户导航更简单,更快速,更容易在文档中的页面之间导航.

所以,我的问题是:

java中是否有可以导入并用于文件转换的本机库?

请分享您的想法以实现上述概念.

San*_*ria 6

在Java中完成这项任务非常困难.但是,如果安装Microsoft HTML Help Workshop,您仍然可以执行此操作.

  1. 首先,您可以通过Apache POI提取Word文档的文本,然后将它们作为HTML文档输出到临时目录.
  2. 接下来,您需要创建一个HHP文件.它应该相当容易创建,因为它是一个文本文件.请遵循此处给出的规格
  3. 那么你也应该有一个相应的HHC文件.它是一个简单的HTML文档,格式如下:

    <html>
    <head>
    </head>
    <body>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Foo Directory">
    <param name="Local" value="BarDirectory/index.htm">
    <param name="ImageNumber" value="1">
    </object></li>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Bar.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Foo.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    </ul>
    </ul>
    </body>
    </html>
    
    Run Code Online (Sandbox Code Playgroud)

    同样,查找HHK文件的结构.

  4. 完成后,您可以hhc.exe <inputfile.hhp>从Java 执行.那应该做的.