标签: visualization

JavaScript是否已准备好可视化大型数据集?

我们通常在Excel中将一些数据(10-50列,数十万行)可视化为折线图或堆积条形图.
用户希望能够放大和缩小图表以获得单个样本,但这些操作确实让Excel瘫痪.

我正在考虑将数据嵌入到HTML页面中,使用内联JavaScript来处理浏览器中的可视化.像flotr JS charting lib这样的东西可以用于图表.

  1. 这是一个愚蠢的想法吗?
  2. 浏览器是否已准备好进行此类加载?
  3. 这是一个解决的问题,我应该在问之前用Google搜索更彻底吗?

javascript browser dom visualization flot

12
推荐指数
2
解决办法
2765
查看次数

git DAG的增量线性化

我是GitX的作者.GitX的一个功能是分支的可视化,这可以在这里看到.

此可视化目前通过读取以正确顺序从git发出的提交来完成.对于每次提交,父母都是已知的,因此以正确的方式构建通道相当容易.

我想通过使用自己的提交池并自己线性化提交来加快这个过程.这允许我重用现有的已加载提交并允许git更快地发出提交,因为它不必以正确的顺序发出它们.

但是,我不确定使用什么算法来实现这一目标.重要的是,构建是增量的,因为提交的加载可能需要很长时间(100,000次提交> 5秒,应该全部显示).

Gitk已经以同样的方式,并有一个补丁在这里,显示它是如何实现的,但我的TCL技能薄弱,补丁是不是很详尽的注释和有点难以遵循.

我也希望这个算法有效,因为它必须处理数十万次提交.它也必须显示在表中,因此访问特定行很快很重要.

我将描述我到目前为止的输入,我想要的输出和一些观察.

输入:

  • 我有一个哈希表形式的当前提交池,它将commit id映射到提交对象.此池不必完整(必须提交所有提交)
  • 我在git的新提交中有一个单独的线程加载,每次加载新提交时都可以调用一个回调.提交没有保证顺序,但在大多数情况下,下一次提交是前一次提交的父级.
  • 提交对象具有自己的修订版ID以及其所有父项的修订版ID
  • 我有一个应该列出的分支头列表.也就是说,不应该显示DAG的单个"顶部".也不必是单个图根.

输出:

  • 我需要按拓扑顺序线性化这些提交.也就是说,在列出其父项后,无法列出提交.
  • 我还需要在上面的屏幕截图中看到的"分支线".这些可能需要预先计算,因为大多数都依赖于他们的孩子.

几点评论:

  • 有必要重新定位提交列表.例如,我们可能必须提交不相关的(分支头),直到提交显示使一个头成为另一个头的祖先.
  • 必须显示多个分支提示
  • 这个过程是增量的很重要,因此在数据仍在加载时至少可以获得部分视图.这意味着必须在中途插入新数据并且必须重新调整分支线.

git visualization objective-c directed-acyclic-graphs

12
推荐指数
1
解决办法
1242
查看次数

Python中的Sankey图

是否有用于生成Sankey图的Python库?

我已经看过这个Sankey图应用程序和库的列表,但它们都没有在Python中.

python diagram visualization graph sankey-diagram

12
推荐指数
2
解决办法
7379
查看次数

源文件中的流程图生成器

我正在寻找一种工具,让我为给定的项目生成流程图.通过查看代码很难理解其他代码,流程图可能非常有用.

我的项目是VS 2010专业版.

visualization flowchart visual-studio-2010 visual-studio

12
推荐指数
2
解决办法
3万
查看次数

方法调用链的Eclipse可视化

我正在寻找一个有用的eclipse插件,可以:

  • 可视化方法链调用(Java)
  • 可视化数据类型层次结构(Java)

你能推荐一下吗?

java visualization eclipse-plugin

12
推荐指数
1
解决办法
1万
查看次数

R:如何在R中的散点图中的'点'上叠加饼图

使用RI想要通过显示其他值的饼图替换二维散点图中的点.

理性的背后是我有数百种元素(蛋白质)的时间序列数据,这些元素来源于监测4种条件的生物实验.我想在y轴上绘制元素(分类数据)并在x轴上绘制事件的时间.为了可视化4个条件之间的相对发生,我想以饼图或圆环图的形式将其可视化,重叠显示在散点图中的相应点上.总体数据密度低,因此重叠不会成为问题.

这可能在R?我在考虑在ggplot2中使用手动缩放,但无法弄清楚如何将饼图定义为缩放.

同样令人感兴趣的是如何最好地聚集这些数据并对其进行相应的排序.

charts visualization r cluster-analysis ggplot2

12
推荐指数
1
解决办法
4323
查看次数

在R中的球体上绘制点

你能帮我在R做一个类似的情节吗?

在此输入图像描述

我希望它具有交互性,以便我可以旋转球体.我想我应该用rgl.我发现一个例子相似,我需要在这里,但是我无法找到一个方法来绘制一个网格,而不是一个充满球体.

UPD:可以帮助回答问题的可重现数据集(我从这里开始):

u <- runif(1000,0,1) 
v <- runif(1000,0,1) 
theta <- 2 * pi * u 
phi   <- acos(2 * v - 1) 
x <- sin(theta) * cos(phi) 
y <- sin(theta) * sin(phi) 
z <- cos(theta) 
library("lattice") 
cloud(z ~ x + y)
Run Code Online (Sandbox Code Playgroud)

visualization r

12
推荐指数
1
解决办法
1968
查看次数

获取使用可视化/分析大型数据集的基本技能

我正在寻找一种学习如何适应大型数据集的方法.我是一名大学生,所以我所做的一切都是"漂亮"的大小和复杂性.本学期与教授一起研究项目,我不得不想象一个有点大(根据我的经验)数据集之间的关系.这是一个15 MB的CSV文件.

我在Python中编写了大部分数据争论,使用GNUPlot可视化.

那里有关于这个主题的可访问的书籍或网站吗?使用Python的奖励积分,更多"基本"可视化系统的奖励积分,而不是依赖于gnuplot.我想是开罗什么的.

寻找能够从数据挖掘,处理到可视化的东西.

编辑:我更需要一些可以教我"重要思想"的东西.我可以自己编写代码,但是寻找人们用来处理大型数据集的技术.我的意思是,我的15 MB足够小,我可以将我需要的所有内容放入内存中,然后开始运算.人们如何看待5 GB数据集?

python visualization data-visualization dataset

11
推荐指数
1
解决办法
2576
查看次数

如何动态地将行/列添加到Google柱形图

我想创建一个柱形图,使用Google Visualization API,我可以发送数据以数组形式填充图表的DataTable.但我需要生成具有可变数量的列/行的图表,具体取决于我的数组包含的内容,我不知道如何正确迭代它们并将它们添加到DataTable.

以下是解析STATIC数据以生成图表的示例:(所有这些都在javascript中)

var data = google.visualization.arrayToDataTable([
      ['Year', 'Sales', 'Expenses'],
      ['2004',  1000,      400],
      ['2005',  1170,      460],
      ['2006',  660,       1120],
      ['2007',  1030,      540]
    ]);
Run Code Online (Sandbox Code Playgroud)

API具有以下用于添加列和行的方法: - 获取与上述相同数据的不同方法:

var data = new google.visualization.DataTable();
data.addColumn('string', 'Year');
data.addColumn('number', 'Sales');
data.addColumn('number', 'Expenses');
data.addRows([  ['2004', 1000 , 400], ['2005', 1170, 460], ['2006', 660, 1120], ['2007',1030,540]
  ]);
Run Code Online (Sandbox Code Playgroud)

我需要的是for循环或双循环迭代我发送的arraylists并动态添加行内容.

更准确地说,在一种情况下我会说上面写的数据,而在其他情况下我会这样:

['Year', 'Sales', 'Expenses' , 'Other'],
['2004',  1000,      400     ,  232   ],
['2005',  1170,      460    ,  421   ],
['2006',  660,       1120    ,  4324  ],
['2007',  1030,      540     , …
Run Code Online (Sandbox Code Playgroud)

javascript visualization google-api

11
推荐指数
1
解决办法
7万
查看次数

数据可视化初学者:先学习处理,d3.js还是其他?

我是视觉/信息设计师和数据分析师.我是Illustrator的专家.我想过渡到动态数据可视化.我最好使用我的矢量文件并将它们连接到数据库.说过我想要精通数据可视化编程.

什么路线?我通过介绍性课程测试了"处理" - 它类似于Illustrator中的逻辑.我在考虑d3.js. 看起来共识是将'处理'和d3结合起来.我应该从哪个程序开始(知道我想利用我的矢量文件).

先感谢您!

processing visualization vector-graphics d3.js

11
推荐指数
1
解决办法
8258
查看次数