为什么我们在Encoder.GetBytes方法中使用flush参数

Question

此链接解释了Encoder.GetBytes方法,并且还有一个名为flush的bool参数.冲洗的解释是:

如果此编码器在转换结束时可以刷新其状态,则为true;否则为false.否则,错误.为了确保正确终止一系列编码字节块,最后一次调用GetBytes可以为flush指定一个值true.

但是我不明白同花顺是做什么的,也许我喝醉了或者是某事:).请你详细解释一下.

Answer 1

假设您通过套接字连接接收数据.您将收到一个长文本作为几个byte[]块.

1个Unicode字符可能在UTF-8流中占用2个以上的字节,并且它可以分成2个字节的块.单独编码2个字节块(并连接字符串)会产生错误.

所以你只能指定flush=true最后一个块.当然,如果你只有1个街区,那么这也是最后一个.

提示:使用TextReader并让它为您处理此问题.

编辑

镜像问题(实际上是问:GetBytes)稍微难以解释.

使用flush=true与使用Encoder.Reset()后相同GetBytes(...).它清除了编码器的"状态",

包括前一个数据块末尾的尾随字符,例如不匹配的高代理

基本思想是相同的:当转换string为字节块时,反之亦然,这些块不是独立的.