我正在使用几种语言,对于其中的一些语言,我有NLTK中的停用词列表,但对于其他语言则没有。
如何从代码中检查nltk.corpus.stopwords.words(“ language”)中是否有语言?
当找不到给定的语言时,我想在不管理异常的情况下执行此操作。
像这样:
if "language" in nltk.corpus.stopwords.languages:
sw = nltk.corpus.stopwords.words("language")
else:
sw = []
...
Run Code Online (Sandbox Code Playgroud)
from nltk.corpus import stopwords
stopwords.fileids()
Run Code Online (Sandbox Code Playgroud)
输出
['arabic',
'azerbaijani',
'danish',
'dutch',
'english',
'finnish',
'french',
'german',
'greek',
'hungarian',
'indonesian',
'italian',
'kazakh',
'nepali',
'norwegian',
'portuguese',
'romanian',
'russian',
'spanish',
'swedish',
'turkish']
Run Code Online (Sandbox Code Playgroud)
这似乎可以解决问题?
| 归档时间: |
|
| 查看次数: |
651 次 |
| 最近记录: |