我正在使用NLTK在我的文本文件上执行kmeans聚类,其中每一行都被视为文档.例如,我的文本文件是这样的:
属于手指死亡打孔
仓促
迈克仓促墙壁
jerichojägermeister规则
规则乐队跟随表演jägermeister阶段
方法
现在我试图运行的演示代码是:https://gist.github.com/xim/1279283
我收到的错误是这样的:
belong finger death punch <br>
hasty <br>
mike hasty walls jericho <br>
jägermeister rules <br>
rules bands follow performing jägermeister stage <br>
approach
Run Code Online (Sandbox Code Playgroud)
这里发生了什么?