我正在尝试启动一个情绪分析项目,我将使用停用词方法.我做了一些研究,我发现nltk有停用词,但是当我执行命令时出现错误.
我所做的是以下内容,以便了解nltk使用的单词(就像你在http://www.nltk.org/book/ch02.html第 4.1节中找到的那样):
from nltk.corpus import stopwords
stopwords.words('english')
Run Code Online (Sandbox Code Playgroud)
但当我按下回车时,我获得了
---------------------------------------------------------------------------
LookupError Traceback (most recent call last)
<ipython-input-6-ff9cd17f22b2> in <module>()
----> 1 stopwords.words('english')
C:\Users\Usuario\Anaconda\lib\site-packages\nltk\corpus\util.pyc in __getattr__(self, attr)
66
67 def __getattr__(self, attr):
---> 68 self.__load()
69 # This looks circular, but its not, since __load() changes our
70 # __class__ to something new:
C:\Users\Usuario\Anaconda\lib\site-packages\nltk\corpus\util.pyc in __load(self)
54 except LookupError, e:
55 try: root = nltk.data.find('corpora/%s' % zip_name)
---> 56 except LookupError: raise e
57
58 # Load the corpus.
LookupError: …Run Code Online (Sandbox Code Playgroud) 我正在制作一个程序,您可以在其中插入一些字母,然后输出是这些字母的所有可能组合。
例如:如果输入是“ABC”,则输出应该是“A”、“B”、“C”、“AB”、“AC”、“BC”、“ABC”、“ACB”等等。 .
最后,我的想法是将所有这些组合放在一个集合中,以便它可以与另一个包含某个英语单词词典的集合相交,该集合是理想的输出
到目前为止,我的脚本是这样的:
import random
p = list(raw_input('Insert some letters: '))
p2 = []
p3 = []
for j in range((len(p))):
p2.append(p[j])
for i in range(len(p)):
a = random.sample(p2,len(p))
p3.append(str("".join(a)))
print p3[]
Run Code Online (Sandbox Code Playgroud)
显然,有一些错误并且不完整。你能帮我完成或告诉我应该走哪条路吗?谢谢阅读