标签: unicode-string

为什么这个字符串的长度比它中的字符数长?

这段代码:

string a = "abc";
string b = "AC";
Console.WriteLine("Length a = {0}", a.Length);
Console.WriteLine("Length b = {0}", b.Length);
Run Code Online (Sandbox Code Playgroud)

输出:

Length a = 3
Length b = 4
Run Code Online (Sandbox Code Playgroud)

为什么?我唯一能想到的是中文字符长度为2个字节,并且该.Length方法返回字节数.

.net c# string unicode unicode-string

145
推荐指数
8
解决办法
2万
查看次数

如何将wchar_t值打印到控制台?

例:

#include <iostream>

using namespace std;

int main()
{
    wchar_t en[] = L"Hello";
    wchar_t ru[] = L"??????"; //Russian language
    cout << ru
         << endl
         << en;
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

此代码仅打印像地址一样的十六进制值.如何打印wchar_t字符串?

c++ string wchar-t unicode-string

66
推荐指数
3
解决办法
7万
查看次数

Java Unicode字符串长度

我正在努力获取unicode字符串的数量,并尝试了各种选项.看起来像一个小问题,但在很大程度上受到了打击.

在这里,我试图获得字符串str1的长度.我得到它6.但实际上它是3.将光标移动到字符串"குமார்"也显示为3个字符.

基本上我想测量长度并打印每个角色.喜欢"கு","மா","ர்".

 public class one {
    public static void main(String[] args) {
            String str1 = new String("??????");
            System.out.print(str1.length());
    }
}
Run Code Online (Sandbox Code Playgroud)

PS:这是泰米尔语.

java string utf-8 utf-16 unicode-string

55
推荐指数
3
解决办法
8610
查看次数

Unicode可打印字符的范围是多少?

任何人都可以告诉我Unicode可打印字符的范围是什么?[例如Ascii可打印字符范围是\ u0020 - \u007f]

unicode character-encoding unicode-string

45
推荐指数
5
解决办法
3万
查看次数

在string,u16string和u32string之间转换

我一直在寻找一种在Unicode字符串类型之间进行转换的方法,并且遇到了这种方法.我不仅没有完全理解方法(没有评论),而且文章暗示将来会有更好的方法.

如果这是最好的方法,请指出是什么让它起作用,如果不是,我想听听有关更好方法的建议.

c++ string unicode unicode-string c++11

43
推荐指数
2
解决办法
4万
查看次数

记事本中的Unicode文件

在记事本中将文本文件另存为"Unicode"时,这意味着什么?它是Utf-8,Utf-16还是Utf-32?提前致谢.

unicode unicode-string

21
推荐指数
1
解决办法
3万
查看次数

返回C#中的字符代码点

如何返回角色的Unicode代码点?例如,如果输入为"A",则输出应为"U + 0041".理想情况下,解决方案应该照顾代理对.

使用代码点我指的是根据Unicode的实际代码点,它与代码单元不同(UTF8具有8位代码单元,UTF16具有16位代码单元,UTF32具有32位代码单元,在后一种情况下为值在考虑到字节序之后,等于代码点).

c# unicode unicode-string

17
推荐指数
3
解决办法
7679
查看次数

Python 3:os.walk()文件路径UnicodeEncodeError:'utf-8'编解码器无法编码:不允许代理

这段代码:

for root, dirs, files in os.walk('.'):
    print(root)
Run Code Online (Sandbox Code Playgroud)

给我这个错误:

UnicodeEncodeError: 'utf-8' codec can't encode character '\udcc3' in position 27: surrogates not allowed
Run Code Online (Sandbox Code Playgroud)

如何在没有像这样的有毒字符串的情况下浏览文件树?

python unicode unicode-string python-3.x python-unicode

16
推荐指数
3
解决办法
3万
查看次数

如何在Python中使用unicode

我试图清除字符串中的所有HTML,因此最终输出是一个文本文件.我对各种"转换器"进行了一些研究,并开始倾向于为实体和符号创建自己的字典并在字符串上运行替换.我正在考虑这个因为我想自动化这个过程,底层html的质量有很多变化.为了开始比较我的解决方案的速度和例如pyparsing的替代方案之一,我决定使用字符串方法replace来测试替换\ xa0.我得到了

UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

实际的代码行是

s=unicodestring.replace('\xa0','')
Run Code Online (Sandbox Code Playgroud)

无论如何 - 我决定我需要用r开头,所以我运行了这行代码:

s=unicodestring.replace(r'\xa0','')
Run Code Online (Sandbox Code Playgroud)

它运行没有错误,但是当我看到一片s时,我看到\ xaO仍在那里

python string unicode replace unicode-string

15
推荐指数
2
解决办法
2万
查看次数

15
推荐指数
2
解决办法
882
查看次数