Ale*_*lex 10 python nltk stop-words
我有一些代码可以从我的数据集中删除停用词,因为停止列表似乎没有删除我想要的大多数单词,我希望在此停止列表中添加单词以便它将删除对于这种情况他们.我用来删除停用词的代码是:
word_list2 = [w.strip() for w in word_list if w.strip() not in nltk.corpus.stopwords.words('english')]
Run Code Online (Sandbox Code Playgroud)
我不确定添加单词的正确语法,似乎无法在任何地方找到正确的语法.任何帮助表示赞赏.谢谢.
Ozi*_*iro 12
您只需使用append方法为其添加单词:
stopwords = nltk.corpus.stopwords.words('english')
stopwords.append('newWord')
Run Code Online (Sandbox Code Playgroud)
或者扩展以附加一个单词列表,如Charlie在评论中所建议的那样.
stopwords = nltk.corpus.stopwords.words('english')
newStopWords = ['stopWord1','stopWord2']
stopwords.extend(newStopWords)
Run Code Online (Sandbox Code Playgroud)
小智 7
import nltk
stopwords = nltk.corpus.stopwords.words('english')
new_words=('re','name', 'user', 'ct')
for i in new_words:
stopwords.append(i)
print(stopwords)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
24761 次 |
| 最近记录: |