tom*_*tom 0 python string split gensim
我在文本文件中有一个10k字的列表,如下所示:
G15 KDN C30A动作标准气刷空气稀释
我正在尝试使用此代码将它们转换为较低的套件令牌,以便使用GenSim进行后续处理:
data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')]
texts = [[word for word in data.lower().split()] for word in data]
Run Code Online (Sandbox Code Playgroud)
我得到以下回调:
AttributeErrorTraceback (most recent call last)
<ipython-input-84-33bbe380449e> in <module>()
1 data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')]
----> 2 texts = [[word for word in data.lower().split()] for word in data]
3
AttributeError: 'list' object has no attribute 'lower'
Run Code Online (Sandbox Code Playgroud)
关于我做错了什么以及如何纠正它的任何建议将不胜感激!!! 谢谢!!
epa*_*aro 13
尝试:
data = [line.strip() for line in open("C:\corpus\TermList.txt", 'r')]
texts = [[word.lower() for word in text.split()] for text in data]
Run Code Online (Sandbox Code Playgroud)
您试图将.lower()应用于数据,这是一个列表.
.lower()只能应用于字符串.