Gus*_*sto 4 python encode utf-8
我怎么得到西里尔而不是 u'...
代码是这样的
def openfile(filename):
with codecs.open(filename, encoding="utf-8") as F:
raw = F.read()
do stuff...
print some_text
Run Code Online (Sandbox Code Playgroud)
版画
>>>[u'.', u',', u':', u'\u0432', u'<', u'>', u'(', u')', u'\u0437', u'\u0456']
它看起来像是some_text一个unicode对象列表.当您打印这样的列表时,它会打印列表reprs中的元素.所以请尝试:
print(u''.join(some_text))
Run Code Online (Sandbox Code Playgroud)
该加入方法串接的元件some_text,用一个空的空间,u''在元件之间.结果是一个unicode对象.