从字典值创建wordcloud

Nie*_*sel 7 python dictionary python-2.7 word-cloud

我刚刚编写了一个脚本,该脚本提取了数千个XML文件的荷兰语文本中的所有语音文本。对于每个说话者,它都会计算一个说话者说几句话的次数。

完成此操作后,我计算了荷兰语拼音中每个说话者的每个单词的TF * IDF值。如果您对此不熟悉,请参见以下链接:TF IDF说明

因此,现在我为荷兰语区的每个演讲者都有一个字典,其中的键是他所说的单词,值是相应的TF * IDF值:

{u'asielzoekers': 0.0034861170591325486,
 u'belastingverlaging': 0.0018551991553514675,
 u'buma': 0.0020712555982839408,
 u'islam': 0.0029519544163739155,
 u'moslims': 0.0027958002747301355,
 u'ouderen': 0.0022803123245457566,
 u'pechtold': 0.0021525864470786928,
 u'president': 0.003281844532743345,
 u'rutte': 0.0023488684001475584,
 u'samsom': 0.0019304632325980841} 
Run Code Online (Sandbox Code Playgroud)

现在,我想根据这些值创建一个wordcloud。我已经不久看着书面的wordcloud模块amueller但据我可以看到这个模块是不是有一本字典,但只是简单的文本工作。

因此,任何有关如何根据字典值创建单词云的帮助都将受到赞赏。

提前致谢!

Nar*_*oTv 12

dictionary= {u'asielzoekers': 0.0034861170591325486,.. u'samsom': 0.0019304632325980841} 


from PIL import Image
import matplotlib.pyplot as plt
from wordcloud import WordCloud

wc = WordCloud(background_color="white",width=1000,height=1000, max_words=10,relative_scaling=0.5,normalize_plurals=False).generate_from_frequencies(dictionary)
plt.imshow(wc)
Run Code Online (Sandbox Code Playgroud)