在文本文件中,有一个字符串"我不喜欢这个".
但是,当我把它读成字符串时,它变成了"我不喜欢这样".我明白\ u2018是"'"的unicode表示.我用
f1 = open (file1, "r")
text = f1.read()
Run Code Online (Sandbox Code Playgroud)
命令做阅读.
现在,是否有可能以这样的方式读取字符串:当它被读入字符串时,它是"我不喜欢这个",而不是像这样的"我不喜欢这样"?
第二次编辑:我看到有些人使用映射来解决这个问题,但实际上,是否没有内置转换可以将这种ANSI转换为unicode(反之亦然)转换?
我在Python中打印一些unicode符号时遇到问题:
# encoding: utf-8
print u'????š?š?'
Run Code Online (Sandbox Code Playgroud)
当我尝试使用Python 2.7在我的VPS Ubuntu 12服务器上运行它时,我收到一个错误:
UnicodeEncodeError:'ascii'编解码器无法编码0-7位的字符:序数不在范围内(128)
为什么它尝试用ASCII编码呢?
命令在我的本地计算机上正确运行.
该文件在utf-8中正确编码.
我有一系列UTF-8字符,例如:
\xd8\xa2\xd8\xb4\xd9\x86\xd8\xa7\xdb\x8c\xdb\x8c \xd8\xa8\xd8\xa7 \xd8\xa2\xd8\xb1\xd9\x85\xd8\xa7\xd9\x86 \xd9\xbe\xd8\xb1\xd9\x88\xda\x98\xd9\x87 \xd9\x84\xd8\xba\xd8\xaa \xd9\x86\xd8\xa7\xd9\x85\xd9\x87 \xd8\xa2\xd8\xb2\xd8\xa7\xd8\xaf
Run Code Online (Sandbox Code Playgroud)
我知道这是来自波斯语网站,应该代表一些波斯语单词.如何用波斯语字符表示此序列?
我正在使用Python来完成我的工作.
在Python中,我可以按名称打印一个unicode字符(例如print(u'\N{snowman}')).有没有办法获得所有有效名称的列表?