损坏的文件处理

Far*_*Joe 34 java excel apache-poi

我想知道是否有人对使用Apache POI处理损坏的文件有任何建议

我正在尝试打开文件并收到此消息:

Exception in thread "main" org.apache.poi.hssf.record.RecordInputStream$LeftoverDataException: Initialisation of record 0x1C left 2 bytes remaining still to be read.
    at org.apache.poi.hssf.record.RecordInputStream.hasNextRecord(RecordInputStream.java:156)
    at org.apache.poi.hssf.record.RecordFactoryInputStream.nextRecord(RecordFactoryInputStream.java:231)
    at org.apache.poi.hssf.record.RecordFactory.createRecords(RecordFactory.java:480)
    at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:301)
    at org.apache.poi.ss.usermodel.WorkbookFactory.create(WorkbookFactory.java:95)
    at ExcelImporter.EditFileImportDialog.main(EditFileImportDialog.java:409)
Run Code Online (Sandbox Code Playgroud)

这是一个SSCCE

import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;

public class EditFileImportDialog {

    /* Omitted irrelevent code */

    public static void main(String[] args) {
        File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");
        try {
            Workbook wb = WorkbookFactory.create(file);  // Line 409 for ref to the exception stack trace
            System.out.println(wb);
        } catch (InvalidFormatException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

仅在此文件中发生这种情况,如果我在excel中打开文件并保存它,然后尝试打开它,则不会抛出异常POI.关于我如何处理这个问题的任何建议?

编辑:

请注意,我的问题可能与此问题有关,但升级POI并未解决我的问题,并且与所描述的文件存在差异.我一直在寻找类似的答案,但也许如果有人知道excel文件本身有什么问题,我可以写一些东西来修补文件.

编辑2

文件创建不在我的控制之下.Excel在打开并重新保存文件时自行修复文件.我的问题是,是否有人能够想出一种方法来调整/增加POI以处理这个受损文件,就像excel能够解决问题一样.

编辑3

回应几条评论/答案:

我的最终目标是根本不使用excel.

  1. 文件已发送.
  2. 程序运行.
  3. 处理错误.
  4. 处理数据.

jav*_*ava 0

尝试从 FileInputStream 创建 XSSFWorkbook。

经过更改,您的示例将如下所示:

import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;

public class EditFileImportDialog {

    /* Omitted irrelevent code */

    public static void main(String[] args) {
        String file = "Z:\\Path\\To\\File_causing_the_trouble.xls";
        try {
            InputStream databaseFile = new FileInputStream(file);
            XSSFWorkbook  wb = new XSSFWorkbook(databaseFile);  
            System.out.println(wb);
        } catch (InvalidFormatException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
Run Code Online (Sandbox Code Playgroud)