标签: data-visualization

如何使IPython笔记本matplotlib内联

我试图在MacOS X上使用Python 2.7.2和IPython 1.1.0上的IPython笔记本.

我无法让matplotlib图形显示为内联.

import matplotlib
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline  
Run Code Online (Sandbox Code Playgroud)

我也试过%pylab inline和ipython命令行参数,--pylab=inline但这没有区别.

x = np.linspace(0, 3*np.pi, 500)
plt.plot(x, np.sin(x**2))
plt.title('A simple chirp')
plt.show()
Run Code Online (Sandbox Code Playgroud)

而不是内联图形,我得到这个:

<matplotlib.figure.Figure at 0x110b9c450>
Run Code Online (Sandbox Code Playgroud)

matplotlib.get_backend()表明我有'module://IPython.kernel.zmq.pylab.backend_inline'后端.

python data-visualization matplotlib ipython jupyter-notebook

779
推荐指数
9
解决办法
102万
查看次数

如何将numpy数组转换为(并显示)图像?

我这样创建了一个数组:

import numpy as np
data = np.zeros( (512,512,3), dtype=np.uint8)
data[256,256] = [255,0,0]
Run Code Online (Sandbox Code Playgroud)

我想要做的是在512x512图像的中心显示一个红点.(至少从...开始......我想我可以从中找出其余部分)

python arrays numpy data-visualization image

191
推荐指数
7
解决办法
34万
查看次数

统计分析和报告编写的工作流程

有没有人对与自定义​​报告编写相关的数据分析工作流程有任何了解?用例基本上是这样的:

  1. 客户委托使用数据分析的报告,例如人口估计和水区的相关地图.

  2. 分析人员下载一些数据,对数据进行检测并保存结果(例如,为每个单位添加一列,或根据区域边界对数据进行子集化).

  3. 分析师分析了(2)中创建的数据,接近她的目标,但看到需要更多数据,因此可以追溯到(1).

  4. 冲洗重复,直到表格和图形符合QA/QC并满足客户要求.

  5. 编写包含表格和图形的报告.

  6. 明年,快乐的客户回来了,想要更新.这应该像通过新下载更新上游数据一样简单(例如,从去年获得建筑许可),并按下"RECALCULATE"按钮,除非规格发生变化.

目前,我只是开始一个目录,并尽我所能.我想要一个更系统化的方法,所以我希望有人能够解决这个问题......我使用了电子表格,SQL,ARCGIS,R和Unix工具.

谢谢!

PS:

下面是一个基本的Makefile,用于检查各种中间数据集(带.RData后缀)和脚本(.R后缀)的依赖关系.使用时间戳来检查依赖关系,因此,如果您touch ss07por.csv,它将看到此文件比依赖它的所有文件/目标更新,并执行给定的脚本以便相应地更新它们.这仍然是一项正在进行的工作,包括放入SQL数据库的步骤,以及像sweave这样的模板语言的步骤.请注意,Make依赖于语法中的选项卡,因此请在剪切和粘贴之前阅读手册.享受并提供反馈!

http://www.gnu.org/software/make/manual/html_node/index.html#Top

R=/home/wsprague/R-2.9.2/bin/R

persondata.RData : ImportData.R ../../DATA/ss07por.csv Functions.R
   $R --slave -f ImportData.R

persondata.Munged.RData : MungeData.R persondata.RData Functions.R
      $R --slave -f MungeData.R

report.txt:  TabulateAndGraph.R persondata.Munged.RData Functions.R
      $R --slave -f TabulateAndGraph.R > report.txt

statistics r data-visualization

181
推荐指数
8
解决办法
4万
查看次数

使用熊猫的相关矩阵

我有一个具有大量功能的数据集,因此分析相关矩阵变得非常困难.我想绘制一个相关矩阵,我们可以使用dataframe.corr()pandas库中的函数.是否有任何内置函数由pandas库提供以绘制此矩阵?

python data-visualization matplotlib information-visualization pandas

175
推荐指数
11
解决办法
33万
查看次数

学习D3.js的好书

我看到了D3.js,我感兴趣所以我买了这本书!我可能错了,但是我发现它没有实现.

有没有人掌握D3.js数据可视化的主要材料?

我可以看到很多潜力D3.js,我非常热衷和感兴趣.

提前致谢!

更新:

我刚刚完成了阅读Scott Murray的网络互动数据可视化,这本好书!试试吧,它是免费的.

javascript data-visualization d3.js

105
推荐指数
3
解决办法
5万
查看次数

将x轴移动到matplotlib中的绘图顶部

基于这个关于matplotlib中的热图的问题,我想将x轴标题移动到图的顶部.

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)

# put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.set_label_position('top') # <-- This doesn't work!

ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()
Run Code Online (Sandbox Code Playgroud)

但是,调用matplotlib的set_label_position(如上所述)似乎没有达到预期的效果.这是我的输出:

在此输入图像描述

我究竟做错了什么?

python plot data-visualization matplotlib

101
推荐指数
3
解决办法
7万
查看次数

在matplotlib中使用pcolor进行热图?

我想制作一个这样的热图(在FlowingData显示): 热图

源数据在这里,但随机数据和标签可以使用,即

import numpy
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = numpy.random.rand(4,4)
Run Code Online (Sandbox Code Playgroud)

在matplotlib中制作热图很容易:

from matplotlib import pyplot as plt
heatmap = plt.pcolor(data)
Run Code Online (Sandbox Code Playgroud)

我甚至发现了一个看起来正确的色彩图参数:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues)

但除此之外,我无法弄清楚如何显示列和行的标签,并以正确的方向显示数据(原点位于左上角而不是左下角).

试图操纵heatmap.axes(例如heatmap.axes.set_xticklabels = column_labels)都失败了.我在这里错过了什么?

python data-visualization matplotlib heatmap

100
推荐指数
3
解决办法
11万
查看次数

除Graphite之外的statsd数据的GUI?

我刚安装了石墨/ statsd用于生产用途.我真的很高兴,但我的一位同事问我是否有办法让它看起来更漂亮.老实说,我不能说我也不奇怪.

有没有替代Graphite UI可以更好地渲染数据,可能使用了一个很棒的前端图形库和http推送?

metrics data-visualization graphite

90
推荐指数
5
解决办法
5万
查看次数

如何在远程服务器上运行Tensorboard?

我是Tensorflow的新手,可以从我正在做的一些可视化中获益.我知道Tensorboard是一个有用的可视化工具,但我如何在远程Ubuntu机器上运行它?

data-visualization machine-learning remote-access tensorflow tensorboard

85
推荐指数
10
解决办法
7万
查看次数

在matplotlib条形图上添加值标签

我被困在一些感觉应该相对容易的事情上.我下面的代码是基于我正在研究的更大项目的示例.我没有理由发布所有细节,所以请接受我带来的数据结构.

基本上,我正在创建一个条形图,我只是想弄清楚如何在条形图上添加值标签(在条形图的中心,或者在它上面).一直在寻找网络上的样本,但没有成功实现我自己的代码.我相信解决方案要么是'text',要么是'annotate',但是我:a)不知道使用哪一个(一般来说,还没弄清楚何时使用哪个).b)无法看到要么呈现价值标签.非常感谢您的帮助,我的代码如下.提前致谢!

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
pd.set_option('display.mpl_style', 'default') 
%matplotlib inline

# Bring some raw data.
frequencies = [6, 16, 75, 160, 244, 260, 145, 73, 16, 4, 1]

# In my original code I create a series and run on that, 
# so for consistency I create a series from the list.
freq_series = pd.Series.from_array(frequencies)

x_labels = [108300.0, 110540.0, 112780.0, 115020.0, 117260.0, 119500.0, 
            121740.0, 123980.0, 126220.0, 128460.0, 130700.0]

# Plot the figure. …
Run Code Online (Sandbox Code Playgroud)

python data-visualization matplotlib python-2.7 pandas

74
推荐指数
5
解决办法
13万
查看次数