我正在尝试存储一个字符串,然后在python中使用nltk对其进行标记化.但我无法理解为什么在对它进行标记后(它创建一个列表)我无法看到列表中的字符串..任何人都可以帮助我PLZ吗?
这是代码:
#a="???? ???"
#b=nltk.word_tokenize(a)
#b
['\xc3\xe5\xe9\xe1', '\xf3\xef\xf5']
Run Code Online (Sandbox Code Playgroud)
我只是希望能够定期查看列表的内容..
Thx提前
您正在使用Python 2,其中前缀的引号表示一个字节,而不是一个字符的字符串(如果你不知道的差异,阅读).要么修改了Python 3,要么修改所有字符串前缀u并打印字符串(而不是显示它们repr,这在Python 2.x中有所不同):
>>> import nltk
>>> a = u'???? ???'
>>> b = nltk.word_tokenize(a)
>>> print(u'\n'.join(b))
????
???
Run Code Online (Sandbox Code Playgroud)