小编the*_*nze的帖子

从单列Pandas数据帧生成单词云

我有一个Pandas数据框,有一列:犯罪类型.该列包含16种不同的"犯罪类别",我希望将其视为文字云,其中的单词根据数据框中的频率进行调整.

在此输入图像描述

我尝试使用以下代码执行此操作:

将数据带入:

fields = ['Crime type']

text2 = pd.read_csv('allCrime.csv', usecols=fields)
Run Code Online (Sandbox Code Playgroud)

要生成单词云:

wordcloud2 = WordCloud().generate(text2)
# Generate plot
plt.imshow(wordcloud2)
plt.axis("off")
plt.show()
Run Code Online (Sandbox Code Playgroud)

但是,我收到此错误:

TypeError: expected string or bytes-like object
Run Code Online (Sandbox Code Playgroud)

我能够使用以下代码从完整数据集创建一个早期的词云,但我希望单词cloud只生成特定列中的单词"犯罪类型"('allCrime.csv'包含大约13列) :

text = open('allCrime.csv').read()
wordcloud = WordCloud().generate(text)
# Generate plot
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
Run Code Online (Sandbox Code Playgroud)

我是Python和Pandas的新手(并且通常编码!)所以感谢所有的帮助.

python dataframe word-cloud pandas

4
推荐指数
3
解决办法
1万
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1

word-cloud ×1