Nie*_*sel 7 python dictionary python-2.7 word-cloud
我刚刚编写了一个脚本,该脚本提取了数千个XML文件的荷兰语文本中的所有语音文本。对于每个说话者,它都会计算一个说话者说几句话的次数。
完成此操作后,我计算了荷兰语拼音中每个说话者的每个单词的TF * IDF值。如果您对此不熟悉,请参见以下链接:TF IDF说明
因此,现在我为荷兰语区的每个演讲者都有一个字典,其中的键是他所说的单词,值是相应的TF * IDF值:
{u'asielzoekers': 0.0034861170591325486,
u'belastingverlaging': 0.0018551991553514675,
u'buma': 0.0020712555982839408,
u'islam': 0.0029519544163739155,
u'moslims': 0.0027958002747301355,
u'ouderen': 0.0022803123245457566,
u'pechtold': 0.0021525864470786928,
u'president': 0.003281844532743345,
u'rutte': 0.0023488684001475584,
u'samsom': 0.0019304632325980841}
Run Code Online (Sandbox Code Playgroud)
现在,我想根据这些值创建一个wordcloud。我已经不久看着书面的wordcloud模块amueller但据我可以看到这个模块是不是有一本字典,但只是简单的文本工作。
因此,任何有关如何根据字典值创建单词云的帮助都将受到赞赏。
提前致谢!
Nar*_*oTv 12
dictionary= {u'asielzoekers': 0.0034861170591325486,.. u'samsom': 0.0019304632325980841}
from PIL import Image
import matplotlib.pyplot as plt
from wordcloud import WordCloud
wc = WordCloud(background_color="white",width=1000,height=1000, max_words=10,relative_scaling=0.5,normalize_plurals=False).generate_from_frequencies(dictionary)
plt.imshow(wc)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3046 次 |
| 最近记录: |