首先采用Java 8流,然后调用forEach(...)

Hig*_*ler 6 java csv java-8 java-stream

我有一个CSV文件,第一行包含标题.所以我认为使用Java 8流是完美的.

    try (Stream<String> stream = Files.lines(csv_file) ){
        stream.skip(1).forEach( line -> handleLine(line) );
    } catch ( IOException ioe ){
        handleError(ioe);
    }
Run Code Online (Sandbox Code Playgroud)

是否可以获取第一个元素,分析它然后调用forEach方法?就像是

stream
      .forFirst( line -> handleFirst(line) )
      .skip(1)
      .forEach( line -> handleLine(line) );
Run Code Online (Sandbox Code Playgroud)

另外:我的CSV文件包含大约1k行,我可以并行处理每一行以加快速度.除了第一行.我需要在我的项目中初始化其他对象的第一行:/所以也许打开BufferedReader,读取第一行,关闭BufferedReader并使用并行流是快速的?

Cod*_*ind 7

通常,您可以使用迭代器来执行此操作:

Stream<Item> stream = ... //initialize your stream
Iterator<Item> i = stream.iterator();
handleFirst(i.next());
i.forEachRemaining(item -> handleRest(item));
Run Code Online (Sandbox Code Playgroud)

在你的程序中,它看起来像这样:

try (Stream<String> stream = Files.lines(csv_file)){
    Iterator<String> i = stream.iterator();
    handleFirst(i.next());
    i.forEachRemaining(s -> handleRest(s));
}
Run Code Online (Sandbox Code Playgroud)

您可能想要添加一些错误检查,以防您获得1或0行,但这应该有效.

  • 应关闭`Files.lines`返回的流,以确保关闭内部缓冲读取器.终端`iterator()`并不意味着关闭流,请参阅http://stackoverflow.com/questions/34072035/why-is-files-lines-and-similar-streams-not-automatically-closed. (3认同)

Tun*_*aki 4

一个很好的方法是读取BufferedReader您的文件,例如在Files.newBufferedReader(path). 然后您可以调用nextLine()一次来检索标题行,并lines()获取Stream<String>所有其他行的 a:

try (BufferedReader br = Files.newBufferedReader(csv_file)){
    String header = br.readLine();
    // if header is null, the file was empty, you may want to throw an exception
    br.lines().forEach(line -> handleLine(line));
}
Run Code Online (Sandbox Code Playgroud)

这是有效的,因为第一次调用readLine()将导致缓冲读取器读取第一行,因此随后,由于lines()是通过读取行​​填充的流,因此它开始读取第二行。当处理结束时,缓冲读取器也会被 try-with-resources 正确关闭。

流管道可能会并行运行,但对于像这样的 I/O 密集型任务,我不会期望任何性能改进,除非每行的处理速度较慢。但在这种情况下要小心forEach:它将同时运行,因此它的代码需要是线程安全的。目前尚不清楚该handleLine方法的作用,但通常,您不需要并且forEach可能更喜欢使用进行可变归约collect,这在并行流中使用是安全的。