标签: visualization

我怎样才能学会创建漂亮的信息图表(与我的R知识有关)?

我是一个忠实的R(r-project.org)用户,并且喜欢信息图表.

我刚看到这篇文章:http: //www.noupe.com/design/fantastic-information-architecture-resources.html

为信息设计人员提供一长串资源.

它让我想要做更美丽(不仅仅是提供信息)的R情节.

您对如何实现这一飞跃有任何建议/资源吗?

我需要拥有/开发哪些书籍/软件/技能才能制作精美的信息图表?

visualization r data-visualization

36
推荐指数
3
解决办法
1万
查看次数

R中的和弦图

是否有任何曲目包可以绘制这样的和弦布局:(这种可视化也称为和弦图)

Chrod Diagramm

visualization r chord-diagram

36
推荐指数
3
解决办法
3万
查看次数

绘制地形图

我一直致力于二维连续数据的可视化项目.这是您可以用来研究2D地图上的高程数据或温度模式的类型.从本质上讲,它实际上是一种将三维平面化为二维加彩色的方法.在我的特定研究领域,我实际上并没有处理地理高程数据,但这是一个很好的比喻,所以我会在这篇文章中坚持下去.

无论如何,在这一点上,我有一个"连续颜色"渲染器,我很满意:

连续颜色渲染器

渐变是标准色轮,其中红色像素表示具有高值的坐标,紫色像素表示低值.

底层数据结构使用了一些非常聪明的(如果我自己这么说的话)插值算法,可以任意深度缩放到地图的细节.

在这一点上,我想绘制一些地形轮廓线(使用二次贝塞尔曲线),但我还没有找到任何描述找到这些曲线的有效算法的好文献.

为了让您了解我正在考虑的内容,这里是一个穷人的实现(渲染器只要遇到与轮廓线相交的像素就使用黑色RGB值):

连续颜色与贫民窟地形线

但是,这种方法存在一些问题:

  • 具有更陡峭斜率的图形区域导致更薄(并且经常断裂)的拓扑线.理想情况下,所有拓扑线应该是连续的.

  • 具有更平坦斜率的图形区域导致更宽的拓扑线(并且通常是整个黑度区域,尤其是在渲染区域的外周边处).

因此,我正在研究一种矢量绘制方法,以获得那些漂亮,完美的1像素厚曲线.算法的基本结构必须包括以下步骤:

  1. 在我想要绘制地形线的每个离散高程处,找到一组坐标,其中该坐标处的高程非常接近(给定任意epsilon值)到所需高程.

  2. 消除冗余点.例如,如果三个点处于完全直线,则中心点是多余的,因为可以在不改变曲线形状的情况下消除它.同样,对于贝塞尔曲线,通常可以通过调整相邻控制点的位置来消除cetain锚点.

  3. 将剩余的点组装成序列,使得两个点之间的每个段近似于高程中性轨迹,并且使得没有两个线段跨越路径.每个点序列必须创建一个闭合多边形,或者必须与渲染区域的边界框相交.

  4. 对于每个顶点,找到一对控制点,使得结果曲线相对于步骤#2中消除的冗余点呈现最小误差.

  5. 确保在当前渲染比例下可见的地形的所有要素都由适当的拓扑线表示.例如,如果数据包含高海拔的尖峰,但直径极小,则仍应绘制拓扑线.如果垂直特征的特征直径小于图像的整体渲染粒度,则只应忽略垂直特征.

但即使在这些限制条件下,我仍然可以想到几种不同的启发式方法来寻找线条:

  • 在渲染边界框中找到高点.从那个高点开始,沿着几条不同的轨迹下坡.只要遍历线超过高程阈值,请将该点添加到特定于高程的存储桶.当遍历路径达到局部最小值时,改变航向并向上行驶.

  • 沿着渲染区域的矩形边界框执行高分辨率遍历.在每个海拔阈值处(以及在拐点处,斜坡反转方向的任何位置),将这些点添加到特定于海拔的铲斗中.完成边界遍历后,从这些桶中的边界点开始向内追踪.

  • 扫描整个渲染区域,以稀疏的规则间隔进行高程测量.对于每次测量,使用它与高程阈值的接近度作为决定是否对其邻居进行插值测量的机制.使用这种技术可以更好地保证整个渲染区域的覆盖范围,但是很难将结果点组合成一个合理的构造路径的顺序.

所以,这些是我的一些想法......

在深入研究实现之前,我想看看StackOverflow上是否有其他人遇到过这类问题的经验,并且可以为准确有效的实现提供指导.

编辑:

我对ellisbben提出的"Gradient"建议特别感兴趣.而我的核心数据结构(忽略一些优化插值快捷键)可以表示为一组2D高斯函数的总和,这是完全可微的.

我想我需要一个数据结构来表示一个三维斜率,以及一个用于计算任意点的斜率矢量的函数.在我的头顶,我不知道该怎么做(虽然它看起来应该很容易),但如果你有一个解释数学的链接,我会非常感激!

更新:

由于ellisbben和Azim的出色贡献,我现在可以计算场中任意点的轮廓角.绘制真正的地形线将很快跟随!

这里有更新的渲染图,有和没有我一直在使用的基于ghetto栅格的topo-renderer.每个图像包括一千个随机采样点,由红点表示.该点处的轮廓角由白线表示.在某些情况下,在给定点处不能测量斜率(基于插值的粒度),因此红点在没有相应的轮廓线的情况下发生.

请享用!

(注意:这些渲染使用与之前渲染不同的表面形貌 - 因为我在每次迭代时随机生成数据结构,而我是原型 - 但核心渲染方法是相同的,所以我相信你会得到这个想法.)

替代文字

替代文字

这是一个有趣的事实:在这些渲染的右侧,你会看到一堆完美的水平和垂直角度的奇怪轮廓线.这些是插值过程的伪像,它使用插值器网格来减少执行核心渲染操作所需的计算次数(约500%).所有这些奇怪的轮廓线出现在两个插值器网格单元之间的边界上.

幸运的是,这些文物实际上并不重要.尽管在斜率计算期间可检测到伪像,但最终渲染器将不会注意到它们,因为它在不同的位深度处操作.


再次更新:

Aaaaaaaand,作为我睡觉前的最后一次放纵,这里是另一对效果图,一个是老式的"连续色彩"风格,另一个是20,000个渐变样本.在这组渲染中,我已经消除了点样本的红点,因为它不必要地使图像混乱.

在这里,由于插补器集合的网格结构,您可以真正看到我之前提到的那些插值工件.我应该强调的是,这些伪像在最终轮廓渲染中将是完全不可见的(因为任何两个相邻内插器单元之间的幅度差异小于渲染图像的位深度).

好胃口!!

替代文字

替代文字

language-agnostic algorithm bezier visualization topographical-lines

34
推荐指数
1
解决办法
1万
查看次数

如何可视化或格式化diff/patch文件?

我有一个补丁文件(统一差异),像输出svn diff,git diffdiff -u ....我想回顾一下,但统一的差异格式 - 特别是有很多文件和变化 - 对我来说很难.

如何从补丁文件中获取格式良好的差异视图?我没有文件本身,只有diff,所以我不能使用所有常规的diff工具.

到目前为止,我最好的两个策略是:

  1. 在gvim中加载diff并获得一些语法突出显示
  2. 将差异粘贴到#!diff-formatted部分中的Trac wiki中,然后单击"预览" - 这将创建一个非常棒的差异视图:
{{{
#!diff
<unified diff here>
}}}

有桌面工具可以做到这一点吗?有没有办法说服kdiff3/diffmerge/p4merge /等可视化补丁文件?复制Trac可视化的东西也会很棒.

编辑:Windows支持的奖励积分,最好是安装程序或无痛安装.

formatting diff visualization patch

34
推荐指数
3
解决办法
3万
查看次数

如何为给定的javascript生成调用图?

我看过" /sf/ask/96973481/ ",并试了一下.如果你想得到一个抽象的语法树,它运作良好.

不幸的是关闭编译器似乎只提供--print_tree,--print_ast--print_pass_graph.它们都不适合我.

我想查看哪个函数调用其他函数的图表.

javascript visualization graph call-graph

34
推荐指数
2
解决办法
1万
查看次数

dpi与数字大小之间的关系

我使用matplotlib创建了一个图,但我已经意识到绘图轴和绘制的线被缩小了. 在此输入图像描述

阅读这个早期的讨论主题,它解释了如何设置数字大小.

fig, ax = plt.subplots()

fig.set_size_inches(3, 1.5)

plt.savefig(file.jpeg, edgecolor='black', dpi=400, facecolor='black', transparent=True)

使用上面的代码(为简洁起见,删除了其他配置),我确实得到了一个具有1200 X 600所需尺寸的结果图像文件(我们应该说分辨率吗?)和所需的文件大小.

投影图像以不寻常的方式缩小,例如注释被放大.我可以在轴上设置标签的大小,但由于底部和右侧的脊仍然很大,因此图形仍然看起来与标尺不成比例,因此绘制的线也是如此.

所以问题是,我们如何解决这个问题,哪些配置出错?

plot visualization graph matplotlib

33
推荐指数
1
解决办法
2万
查看次数

如何在基于d3.js的"家庭树"中展示婚姻?

我是一名HTML/CSS开发人员,正在研究构建"家庭树"的javascript解决方案,这种解决方案需要以有意义的方式展示婚姻(当然来自家庭以外).

基本上我看着它立足于一个树状图的基础上,d3.js,例如http://bl.ocks.org/4063570,但我在努力寻找任何东西在那里,表示"结婚".

下面是我将基于它的数据的图像:

这是我的数据

任何帮助/建议/链接将不胜感激!我只是不知道它是否可能,但是我很乐意使用d3.js,因为它看起来很精致,而且看起来很多功能.

javascript tree visualization genealogy d3.js

32
推荐指数
2
解决办法
2万
查看次数

使用"搜索,显示上下文和按需扩展"概念进行大数据可视化

我正在尝试将存储在数据库中的巨大网络(3M节点和13M边缘)可视化.对于实时交互性,我计划仅根据用户查询显示图形的一部分,并根据需要进行扩展.例如,当用户点击某个节点时,我会扩展其邻域.(这被称为"搜索,显示上下文,展开随需应变"的文章).

我已经研究了几个可视化工具,包括Gephi,D3等.他们将文本文件作为输入,但我不知道他们如何连接数据库并根据用户的交互更新图表.

链接的文件实现了这样的系统,但他们没有描述他们使用的工具.

如何使用上述标准可视化此类数据?

visualization graph-visualization

32
推荐指数
1
解决办法
3万
查看次数

为热图创建颜色的算法是什么?

假设值从0到1归一化,获得颜色以创建这样的热图的算法是什么?

1为红色,.5为绿色,0为深蓝色.

在RMagick/ImageMagick工作.

热图

charts visualization graph colors heatmap

31
推荐指数
3
解决办法
4万
查看次数

是否有比"彩虹"色彩图更好的色标?

我正在绘制x,y空间中的一系列曲线,其中每条曲线由标量值z标识.我希望将z值映射到每条线的颜色,但是大多数色彩图/颜色表都是在考虑图像的情况下构建的(例如,在白色背景上,灰度色彩图隐藏了z的一个极端).

彩虹/光谱/喷射色图 - 这是许多绘图程序中的默认值 - 更好,但是白色背景上的黄色/青色线的可见性差,蓝色/青色/绿色之间的色彩对比度差.Borland和Taylor进一步讨论了彩虹色图的这个问题和其他问题:

有人能推荐更好的东西吗?我正在寻找的一些方面:

  1. 所有颜色的高能见度反对白色背景
  2. 直观的感知排序(红 - 黄 - 蓝比红 - 蓝 - 黄更有意义)
  3. 色彩之间的色度对比度很好

编辑/更新:每个endolith的请求,这是一个简化的示例图: 样本图用灰色和喷射彩色图 "灰色"色图和它的亲戚(从黑色开始到白色结束)是为图像设计的,但是当用于在白色背景上绘制线条或点时,有些将很难看到或看不见."jet"色图和它的光谱亲属通常也有黄色,绿色或其他颜色,很难在白色背景上看到.

visualization data-visualization graph

30
推荐指数
4
解决办法
2万
查看次数