字符串和4字节Unicode字符

Arx*_*iss 5 c# string unicode astral-plane

我在C#中有一个关于字符串和字符的问题.我发现C#中的字符串是一个Unicode字符串,而char需要2个字节.所以每个char都采用UTF-16编码.这很好,但我也在维基百科上读到有些字符在UTF-16中占用4个字节.

我正在做一个程序,可以让你为字母数字显示绘制字符.在程序中还有一个测试器,你可以在其中编写一些字符串,它会为你绘制它以查看它的外观.

所以我应该如何使用字符串,用户写入一个占用4个字节的字符,即2个字符.因为我需要通过字符串char来char,所以在列表中找到这个char,并将其绘制到面板中.

Esa*_*ija 5

你你可以这样做:

for( int i = 0; i < str.Length; ++i ) {
    int codePoint = Char.ConvertToUTF32( str, i );
    if( codePoint > 0xffff ) {
        i++;
    }
}
Run Code Online (Sandbox Code Playgroud)

然后将codePoint任何可能的代码点表示为 32 位整数。