什么是简单的可视化工具来显示字数?

Lon*_*guy 3 graphics nlp r data-visualization

我有一个文本文件,其中包含一个短语在语料库中出现的次数.该文件看起来像这样,短语及其计数用"="分隔:

phrase1=100
phrase2=156
... and so on
Run Code Online (Sandbox Code Playgroud)

什么是一个很好的简单可视化工具,可以采取这个文件(或稍微修改过的版本),并提供一个很好的泡沫形式的可视化,其中气泡大小与短语的计数成比例.我希望这句话写在泡沫里面.

dou*_*oug 7

您在OP(气泡图)中引用的绘图类型也称为气球图.

您的问题的标题是针对在给定文本中直观地显示单词频率的更一般的问题.鉴于此,也许值得一提的是信息图表专家对气泡图的批评,因为该图基于将数据值映射到圆形区域.

不幸的是,同样的大师还没有就一套合理的替代方案达成一致(据我所知).

用于显示术语频率的气泡图的最佳替代方案,我能想到的,通常被称为标签云.

在他的博客上,Statistics,R,Graphics和Fun,Yihui Xie,编写了一个使用R创建标签云的优秀教程.他的教程非常出色有两个原因 - 它用一步一步的代码编写得很好,并且结果很美.

有关创建更好的标签云的教程,请参阅博客上的博客.

但如果你想要一个泡泡(又称气球)情节,你就走了.

它们很容易在R中创建.有一个精心详细的分步教程,用于在优秀的Flow Data站点上创建和抛光Bubble Charts .

此外,R Package gplots(可在CRAN上获得)包括一个函数balloonplot,用于直接绘制这些.

来自流动数据网站:

在此输入图像描述