Hig*_*ler 6 java csv java-8 java-stream
我有一个CSV文件,第一行包含标题.所以我认为使用Java 8流是完美的.
try (Stream<String> stream = Files.lines(csv_file) ){
stream.skip(1).forEach( line -> handleLine(line) );
} catch ( IOException ioe ){
handleError(ioe);
}
Run Code Online (Sandbox Code Playgroud)
是否可以获取第一个元素,分析它然后调用forEach方法?就像是
stream
.forFirst( line -> handleFirst(line) )
.skip(1)
.forEach( line -> handleLine(line) );
Run Code Online (Sandbox Code Playgroud)
另外:我的CSV文件包含大约1k行,我可以并行处理每一行以加快速度.除了第一行.我需要在我的项目中初始化其他对象的第一行:/所以也许打开BufferedReader,读取第一行,关闭BufferedReader并使用并行流是快速的?
通常,您可以使用迭代器来执行此操作:
Stream<Item> stream = ... //initialize your stream
Iterator<Item> i = stream.iterator();
handleFirst(i.next());
i.forEachRemaining(item -> handleRest(item));
Run Code Online (Sandbox Code Playgroud)
在你的程序中,它看起来像这样:
try (Stream<String> stream = Files.lines(csv_file)){
Iterator<String> i = stream.iterator();
handleFirst(i.next());
i.forEachRemaining(s -> handleRest(s));
}
Run Code Online (Sandbox Code Playgroud)
您可能想要添加一些错误检查,以防您获得1或0行,但这应该有效.
一个很好的方法是读取BufferedReader您的文件,例如在Files.newBufferedReader(path). 然后您可以调用nextLine()一次来检索标题行,并lines()获取Stream<String>所有其他行的 a:
try (BufferedReader br = Files.newBufferedReader(csv_file)){
String header = br.readLine();
// if header is null, the file was empty, you may want to throw an exception
br.lines().forEach(line -> handleLine(line));
}
Run Code Online (Sandbox Code Playgroud)
这是有效的,因为第一次调用readLine()将导致缓冲读取器读取第一行,因此随后,由于lines()是通过读取行填充的流,因此它开始读取第二行。当处理结束时,缓冲读取器也会被 try-with-resources 正确关闭。
流管道可能会并行运行,但对于像这样的 I/O 密集型任务,我不会期望任何性能改进,除非每行的处理速度较慢。但在这种情况下要小心forEach:它将同时运行,因此它的代码需要是线程安全的。目前尚不清楚该handleLine方法的作用,但通常,您不需要并且forEach可能更喜欢使用进行可变归约collect,这在并行流中使用是安全的。
| 归档时间: |
|
| 查看次数: |
1455 次 |
| 最近记录: |