要将utf-8编码的二进制字符串拆分为两部分,第一部分包含前两个字符,第二部分包含其余部分,您可以使用该函数:
split_2(<<One/utf8,Two/utf8,Rest/binary>>) ->
%% One and Two are now the unicode codepoints of the first 2 characters.
[<<One/utf8,Two/utf8>>,Rest].
Run Code Online (Sandbox Code Playgroud)
使用utf8匹配二进制文件将提取第一个utf-8编码字符,并将unicode代码点作为整数返回,这就是为什么我们必须构建前两个字符的结果二进制文件.如果二进制文件中没有2个utf-8编码字符,则此函数将失败.
位串和二进制之间的区别在于二进制的大小必须是8位的倍数,而位串可以是任何大小.
| 归档时间: |
|
| 查看次数: |
1094 次 |
| 最近记录: |