我们通常在Excel中将一些数据(10-50列,数十万行)可视化为折线图或堆积条形图.
用户希望能够放大和缩小图表以获得单个样本,但这些操作确实让Excel瘫痪.
我正在考虑将数据嵌入到HTML页面中,使用内联JavaScript来处理浏览器中的可视化.像flotr JS charting lib这样的东西可以用于图表.
我是GitX的作者.GitX的一个功能是分支的可视化,这可以在这里看到.
此可视化目前通过读取以正确顺序从git发出的提交来完成.对于每次提交,父母都是已知的,因此以正确的方式构建通道相当容易.
我想通过使用自己的提交池并自己线性化提交来加快这个过程.这允许我重用现有的已加载提交并允许git更快地发出提交,因为它不必以正确的顺序发出它们.
但是,我不确定使用什么算法来实现这一目标.重要的是,构建是增量的,因为提交的加载可能需要很长时间(100,000次提交> 5秒,应该全部显示).
Gitk已经以同样的方式,并有一个补丁在这里,显示它是如何实现的,但我的TCL技能薄弱,补丁是不是很详尽的注释和有点难以遵循.
我也希望这个算法有效,因为它必须处理数十万次提交.它也必须显示在表中,因此访问特定行很快很重要.
我将描述我到目前为止的输入,我想要的输出和一些观察.
输入:
输出:
几点评论:
是否有用于生成Sankey图的Python库?
我已经看过这个Sankey图应用程序和库的列表,但它们都没有在Python中.
我正在寻找一种工具,让我为给定的项目生成流程图.通过查看代码很难理解其他代码,流程图可能非常有用.
我的项目是VS 2010专业版.
我正在寻找一个有用的eclipse插件,可以:
你能推荐一下吗?
使用RI想要通过显示其他值的饼图替换二维散点图中的点.
理性的背后是我有数百种元素(蛋白质)的时间序列数据,这些元素来源于监测4种条件的生物实验.我想在y轴上绘制元素(分类数据)并在x轴上绘制事件的时间.为了可视化4个条件之间的相对发生,我想以饼图或圆环图的形式将其可视化,重叠显示在散点图中的相应点上.总体数据密度低,因此重叠不会成为问题.
这可能在R?我在考虑在ggplot2中使用手动缩放,但无法弄清楚如何将饼图定义为缩放.
同样令人感兴趣的是如何最好地聚集这些数据并对其进行相应的排序.
你能帮我在R做一个类似的情节吗?
我希望它具有交互性,以便我可以旋转球体.我想我应该用rgl.我发现一个例子相似,我需要在这里,但是我无法找到一个方法来绘制一个网格,而不是一个充满球体.
UPD:可以帮助回答问题的可重现数据集(我从这里开始):
u <- runif(1000,0,1)
v <- runif(1000,0,1)
theta <- 2 * pi * u
phi <- acos(2 * v - 1)
x <- sin(theta) * cos(phi)
y <- sin(theta) * sin(phi)
z <- cos(theta)
library("lattice")
cloud(z ~ x + y)
Run Code Online (Sandbox Code Playgroud) 我正在寻找一种学习如何适应大型数据集的方法.我是一名大学生,所以我所做的一切都是"漂亮"的大小和复杂性.本学期与教授一起研究项目,我不得不想象一个有点大(根据我的经验)数据集之间的关系.这是一个15 MB的CSV文件.
我在Python中编写了大部分数据争论,使用GNUPlot可视化.
那里有关于这个主题的可访问的书籍或网站吗?使用Python的奖励积分,更多"基本"可视化系统的奖励积分,而不是依赖于gnuplot.我想是开罗什么的.
寻找能够从数据挖掘,处理到可视化的东西.
编辑:我更需要一些可以教我"重要思想"的东西.我可以自己编写代码,但是寻找人们用来处理大型数据集的技术.我的意思是,我的15 MB足够小,我可以将我需要的所有内容放入内存中,然后开始运算.人们如何看待5 GB数据集?
我想创建一个柱形图,使用Google Visualization API,我可以发送数据以数组形式填充图表的DataTable.但我需要生成具有可变数量的列/行的图表,具体取决于我的数组包含的内容,我不知道如何正确迭代它们并将它们添加到DataTable.
以下是解析STATIC数据以生成图表的示例:(所有这些都在javascript中)
var data = google.visualization.arrayToDataTable([
['Year', 'Sales', 'Expenses'],
['2004', 1000, 400],
['2005', 1170, 460],
['2006', 660, 1120],
['2007', 1030, 540]
]);
Run Code Online (Sandbox Code Playgroud)
API具有以下用于添加列和行的方法: - 获取与上述相同数据的不同方法:
var data = new google.visualization.DataTable();
data.addColumn('string', 'Year');
data.addColumn('number', 'Sales');
data.addColumn('number', 'Expenses');
data.addRows([ ['2004', 1000 , 400], ['2005', 1170, 460], ['2006', 660, 1120], ['2007',1030,540]
]);
Run Code Online (Sandbox Code Playgroud)
我需要的是for循环或双循环迭代我发送的arraylists并动态添加行内容.
更准确地说,在一种情况下我会说上面写的数据,而在其他情况下我会这样:
['Year', 'Sales', 'Expenses' , 'Other'],
['2004', 1000, 400 , 232 ],
['2005', 1170, 460 , 421 ],
['2006', 660, 1120 , 4324 ],
['2007', 1030, 540 , …Run Code Online (Sandbox Code Playgroud) 我是视觉/信息设计师和数据分析师.我是Illustrator的专家.我想过渡到动态数据可视化.我最好使用我的矢量文件并将它们连接到数据库.说过我想要精通数据可视化编程.
什么路线?我通过介绍性课程测试了"处理" - 它类似于Illustrator中的逻辑.我在考虑d3.js. 看起来共识是将'处理'和d3结合起来.我应该从哪个程序开始(知道我想利用我的矢量文件).
先感谢您!
visualization ×10
javascript ×2
python ×2
r ×2
browser ×1
charts ×1
d3.js ×1
dataset ×1
diagram ×1
dom ×1
flot ×1
flowchart ×1
ggplot2 ×1
git ×1
google-api ×1
graph ×1
java ×1
objective-c ×1
processing ×1