这个问题仅适用于python:
我有一个俄语字符串中的城市名称,其格式为Unicode,如:
\u041C\u043E\u0441\u043A\u0432\u0430
手段
??????
如何获取原始文本而不是unicode字符?
注意:请勿使用任何导入模块
>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
??????
Run Code Online (Sandbox Code Playgroud)
你的字符串是一个unicode字符串,因为每个字符/代码点只有一个unicode字符串可用,你应该在字符串前加上u.否则是一个常规字符串,每个\ u都算作一个常规的ascii字符:
>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36
Run Code Online (Sandbox Code Playgroud)