NLTK停用词语言

Fer*_*ino 2 python nltk

我正在使用几种语言,对于其中的一些语言,我有NLTK中的停用词列表,但对于其他语言则没有。

如何从代码中检查nltk.corpus.stopwords.words(“ language”)中是否有语言?

当找不到给定的语言时,我想在不管理异常的情况下执行此操作。

像这样:

if "language" in nltk.corpus.stopwords.languages:
   sw = nltk.corpus.stopwords.words("language")
else:
   sw = []
...
Run Code Online (Sandbox Code Playgroud)

Ian*_*uah 5

from nltk.corpus import stopwords
stopwords.fileids()
Run Code Online (Sandbox Code Playgroud)

输出

['arabic',
 'azerbaijani',
 'danish',
 'dutch',
 'english',
 'finnish',
 'french',
 'german',
 'greek',
 'hungarian',
 'indonesian',
 'italian',
 'kazakh',
 'nepali',
 'norwegian',
 'portuguese',
 'romanian',
 'russian',
 'spanish',
 'swedish',
 'turkish']
Run Code Online (Sandbox Code Playgroud)

这似乎可以解决问题?