如何使用AsynchronousFileChannel高效读取StringBuffer

got*_*ch4 5 java nio utf

所以你知道你可以使用AsynchronousFileChannel将整个文件读取到String:

 AsynchronousFileChannel fileChannel = AsynchronousFileChannel.open(filePath, StandardOpenOption.READ);
            long len = fileChannel.size();

            ReadAttachment readAttachment = new ReadAttachment();
            readAttachment.byteBuffer = ByteBuffer.allocate((int) len);
            readAttachment.asynchronousChannel = fileChannel;

            CompletionHandler<Integer, ReadAttachment> completionHandler = new CompletionHandler<Integer, ReadAttachment>() {

                @Override
                public void completed(Integer result, ReadAttachment attachment) {

                    String content = new String(attachment.byteBuffer.array());
                    try {
                        attachment.asynchronousChannel.close();
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                    completeCallback.accept(content);
                }

                @Override
                public void failed(Throwable exc, ReadAttachment attachment) {
                    exc.printStackTrace();
                    exceptionError(errorCallback, completeCallback, String.format("error while reading file [%s]: %s", path, exc.getMessage()));
                }
            };

            fileChannel.read(
                    readAttachment.byteBuffer,
                    0,
                    readAttachment,
                    completionHandler);
Run Code Online (Sandbox Code Playgroud)

假设现在,我不想分配整个ByteBuffer,而是逐行读取.我可以使用ByteBuffer固定宽度并保持read多次调用,总是复制并附加到StringBuffer,直到我没有到达新行...我唯一关心的是:因为我正在阅读的文件的编码可能是每个字符多字节(UTF的东西),可能会发生读取字节以不完整的字符结束.如何确保我将正确的字节转换为字符串而不是弄乱编码?

更新:答案在所选答案的评论中,但它基本上指向CharsetDecoder.

Zby*_*000 1

如果您有明确的 ASCII 分隔符(\n),则无需关心不完整的字符串,因为该字符映射到单字节(反之亦然)。

因此,只需在输入中搜索 '\n' 字节并读取之前的任何内容并将其转换为字符串即可。循环直到找不到更多新行。然后压缩缓冲区并将其重新用于下次读取。如果找不到新行,则必须分配更大的缓冲区,复制旧行的内容,然后再次调用读取。

编辑:正如评论中提到的,您可以将 ByteBuffer即时传递给CharsetDecoder并将其转换为 CharBuffer (然后附加到 StringBuilder 或任何首选的解决方案)。