如何避免在解析CSV行中的空位置时触发ArrayIndexOutOfBoundsException?

Per*_*rcy 1 java csv exception-handling string-parsing indexoutofboundsexception

String[] values = line.split(",");

Long locId = Long.parseLong(replaceQuotes(values[0]));
String country = replaceQuotes(values[1]);
String region = replaceQuotes(values[2]);
String city = replaceQuotes(values[3]);
String postalCode = replaceQuotes(values[4]);
String latitude = replaceQuotes(values[5]);
String longitude = replaceQuotes(values[6]);
String metroCode = replaceQuotes(values[7]);
String areaCode = replaceQuotes(values[8]);

//...

public String replaceQuotes(String txt){
    txt = txt.replaceAll("\"", "");
    return txt;
}
Run Code Online (Sandbox Code Playgroud)

我正在使用上面的代码用这种格式的数据解析CSV:

828,"US","IL","Melrose Park","60160",41.9050,-87.8641,602,708
Run Code Online (Sandbox Code Playgroud)

但是,当我遇到一系列数据时,如下所示我得到了 java.lang.ArrayIndexOutOfBoundsException: 7

1,"O1","","","",0.0000,0.0000,,
Run Code Online (Sandbox Code Playgroud)

这是否意味着我甚至试图访问该值时values[7],会抛出异常?

如果是这样,我如何解析文本行的那个位置不包含数据的行?

Joa*_*uer 6

首先,String.split()它不是一个很好的CSV解析器:它不知道引号,只要你的一个引用值包含一个逗号就会搞乱.

话虽如此,默认情况下会String.split()留下空的尾随元素.您可以使用双参数变量来影响它:

String[] values = line.split(",", -1);
Run Code Online (Sandbox Code Playgroud)
  • -1 (或任何负值)表示数组将尽可能大.
  • 使用正值可以完成最大量的拆分(意味着除此之外的所有内容都将是单个值,即使它包含逗号).
  • 0(默认情况下,如果使用单参数值)意味着数组将尽可能大,空的尾随值将被排除在数组之外(完全如您所见).