我试图摆脱这个for循环,而是使用list comprehension来给出相同的结果.
fd= nltk.FreqDist()
html = requests.get("http://www.nrc.nl/nieuws/2015/04/19/louise-gunning-vertrekt-als-voorzitter-bestuur-uva/")
raw = BeautifulSoup(html.text).text
for word in nltk.word_tokenize(raw):
freqdist[word.lower()] += 1
Run Code Online (Sandbox Code Playgroud)
我不确定它是否可能,但由于+ = 1,我无法让它工作.我试过了:
[freqdist[word.lower()] +=1 for word in nltk.word_tokenize(raw)]
Run Code Online (Sandbox Code Playgroud)
但这只会引发错误.有人能指出我正确的方向吗?