所以你知道你可以使用AsynchronousFileChannel将整个文件读取到String:
AsynchronousFileChannel fileChannel = AsynchronousFileChannel.open(filePath, StandardOpenOption.READ);
long len = fileChannel.size();
ReadAttachment readAttachment = new ReadAttachment();
readAttachment.byteBuffer = ByteBuffer.allocate((int) len);
readAttachment.asynchronousChannel = fileChannel;
CompletionHandler<Integer, ReadAttachment> completionHandler = new CompletionHandler<Integer, ReadAttachment>() {
@Override
public void completed(Integer result, ReadAttachment attachment) {
String content = new String(attachment.byteBuffer.array());
try {
attachment.asynchronousChannel.close();
} catch (IOException e) {
e.printStackTrace();
}
completeCallback.accept(content);
}
@Override
public void failed(Throwable exc, ReadAttachment attachment) {
exc.printStackTrace();
exceptionError(errorCallback, completeCallback, String.format("error while reading file [%s]: %s", path, exc.getMessage()));
}
};
fileChannel.read(
readAttachment.byteBuffer,
0,
readAttachment,
completionHandler);
Run Code Online (Sandbox Code Playgroud)
假设现在,我不想分配整个ByteBuffer,而是逐行读取.我可以使用ByteBuffer固定宽度并保持read多次调用,总是复制并附加到StringBuffer,直到我没有到达新行...我唯一关心的是:因为我正在阅读的文件的编码可能是每个字符多字节(UTF的东西),可能会发生读取字节以不完整的字符结束.如何确保我将正确的字节转换为字符串而不是弄乱编码?
更新:答案在所选答案的评论中,但它基本上指向CharsetDecoder.
如果您有明确的 ASCII 分隔符(\n),则无需关心不完整的字符串,因为该字符映射到单字节(反之亦然)。
因此,只需在输入中搜索 '\n' 字节并读取之前的任何内容并将其转换为字符串即可。循环直到找不到更多新行。然后压缩缓冲区并将其重新用于下次读取。如果找不到新行,则必须分配更大的缓冲区,复制旧行的内容,然后再次调用读取。
编辑:正如评论中提到的,您可以将 ByteBuffer即时传递给CharsetDecoder并将其转换为 CharBuffer (然后附加到 StringBuilder 或任何首选的解决方案)。
| 归档时间: |
|
| 查看次数: |
560 次 |
| 最近记录: |