相关疑难解决方法(0)

FreqDist与NLTK

python中的NLTK有一个函数FreqDist,它可以为您提供文本中单词的频率.我试图将我的文本作为参数传递但结果是以下形式:['','e','a','o','n','i','t','r', 's','l','d','h','c','y','b','u','g','\n','m','p',' w','f',',','v','.',''','k','B',''','M','H','9','C' ,' - ','N','S','1','A','G','P','T','W','[',']','(',' )','0','7','E','J','O','R','j','x']而在NLTK网站的例子中,结果是整个单词不仅仅是我是这样做的:

file_y = open(fileurl)
p = file_y.read()
fdist = FreqDist(p)
vocab = fdist.keys()
vocab[:100]
Run Code Online (Sandbox Code Playgroud)

你知道我错了吗?谢谢!

python nlp nltk

26
推荐指数
4
解决办法
6万
查看次数

标签 统计

nlp ×1

nltk ×1

python ×1