标签: data-visualization

如何使IPython笔记本matplotlib内联

我试图在MacOS X上使用Python 2.7.2和IPython 1.1.0上的IPython笔记本.

我无法让matplotlib图形显示为内联.

import matplotlib
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

Run Code Online (Sandbox Code Playgroud)

我也试过%pylab inline和ipython命令行参数,--pylab=inline但这没有区别.

x = np.linspace(0, 3*np.pi, 500)
plt.plot(x, np.sin(x**2))
plt.title('A simple chirp')
plt.show()

Run Code Online (Sandbox Code Playgroud)

而不是内联图形,我得到这个:

<matplotlib.figure.Figure at 0x110b9c450>

Run Code Online (Sandbox Code Playgroud)

并matplotlib.get_backend()表明我有'module://IPython.kernel.zmq.pylab.backend_inline'后端.

python data-visualization matplotlib ipython jupyter-notebook

Ian*_*ske

2019 03-30

779
推荐指数

9
解决办法

102万
查看次数

如何将numpy数组转换为(并显示)图像？

我这样创建了一个数组:

import numpy as np
data = np.zeros( (512,512,3), dtype=np.uint8)
data[256,256] = [255,0,0]

Run Code Online (Sandbox Code Playgroud)

我想要做的是在512x512图像的中心显示一个红点.(至少从...开始......我想我可以从中找出其余部分)

python arrays numpy data-visualization image

jls*_*int

2019 04-28

191
推荐指数

7
解决办法

34万
查看次数

统计分析和报告编写的工作流程

有没有人对与自定义报告编写相关的数据分析工作流程有任何了解？用例基本上是这样的:

客户委托使用数据分析的报告,例如人口估计和水区的相关地图.
分析人员下载一些数据,对数据进行检测并保存结果(例如,为每个单位添加一列,或根据区域边界对数据进行子集化).
分析师分析了(2)中创建的数据,接近她的目标,但看到需要更多数据,因此可以追溯到(1).
冲洗重复,直到表格和图形符合QA/QC并满足客户要求.
编写包含表格和图形的报告.
明年,快乐的客户回来了,想要更新.这应该像通过新下载更新上游数据一样简单(例如,从去年获得建筑许可),并按下"RECALCULATE"按钮,除非规格发生变化.

目前,我只是开始一个目录,并尽我所能.我想要一个更系统化的方法,所以我希望有人能够解决这个问题......我使用了电子表格,SQL,ARCGIS,R和Unix工具.

谢谢!

PS:

下面是一个基本的Makefile,用于检查各种中间数据集(带.RData后缀)和脚本(.R后缀)的依赖关系.使用时间戳来检查依赖关系,因此,如果您touch ss07por.csv,它将看到此文件比依赖它的所有文件/目标更新,并执行给定的脚本以便相应地更新它们.这仍然是一项正在进行的工作,包括放入SQL数据库的步骤,以及像sweave这样的模板语言的步骤.请注意,Make依赖于语法中的选项卡,因此请在剪切和粘贴之前阅读手册.享受并提供反馈!

http://www.gnu.org/software/make/manual/html_node/index.html#Top

R=/home/wsprague/R-2.9.2/bin/R

persondata.RData : ImportData.R ../../DATA/ss07por.csv Functions.R
   $R --slave -f ImportData.R

persondata.Munged.RData : MungeData.R persondata.RData Functions.R
      $R --slave -f MungeData.R

report.txt:  TabulateAndGraph.R persondata.Munged.RData Functions.R
      $R --slave -f TabulateAndGraph.R > report.txt

statistics r data-visualization

for*_*ait

2015 09-18

181
推荐指数

8
解决办法

4万
查看次数

使用熊猫的相关矩阵

我有一个具有大量功能的数据集,因此分析相关矩阵变得非常困难.我想绘制一个相关矩阵,我们可以使用dataframe.corr()pandas库中的函数.是否有任何内置函数由pandas库提供以绘制此矩阵？

python data-visualization matplotlib information-visualization pandas

Gau*_*ngh

2019 03-28

175
推荐指数

11
解决办法

33万
查看次数

学习D3.js的好书

我看到了D3.js,我感兴趣所以我买了这本书!我可能错了,但是我发现它没有实现.

有没有人掌握D3.js数据可视化的主要材料？

我可以看到很多潜力D3.js,我非常热衷和感兴趣.

提前致谢!

更新:

我刚刚完成了阅读Scott Murray的网络互动数据可视化,这本好书!试试吧,它是免费的.

javascript data-visualization d3.js

lay*_*cat

2018 12-17

105
推荐指数

3
解决办法

5万
查看次数

将x轴移动到matplotlib中的绘图顶部

基于这个关于matplotlib中的热图的问题,我想将x轴标题移动到图的顶部.

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)

# put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.set_label_position('top') # <-- This doesn't work!

ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()

Run Code Online (Sandbox Code Playgroud)

但是,调用matplotlib的set_label_position(如上所述)似乎没有达到预期的效果.这是我的输出:

在此输入图像描述

我究竟做错了什么？

python plot data-visualization matplotlib

Jas*_*ram

2017 05-23

101
推荐指数

3
解决办法

7万
查看次数

在matplotlib中使用pcolor进行热图？

我想制作一个这样的热图(在FlowingData上显示):

源数据在这里,但随机数据和标签可以使用,即

import numpy
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = numpy.random.rand(4,4)

Run Code Online (Sandbox Code Playgroud)

在matplotlib中制作热图很容易:

from matplotlib import pyplot as plt
heatmap = plt.pcolor(data)

Run Code Online (Sandbox Code Playgroud)

我甚至发现了一个看起来正确的色彩图参数:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues)

但除此之外,我无法弄清楚如何显示列和行的标签,并以正确的方向显示数据(原点位于左上角而不是左下角).

试图操纵heatmap.axes(例如heatmap.axes.set_xticklabels = column_labels)都失败了.我在这里错过了什么？

python data-visualization matplotlib heatmap

Jas*_*ram

2016 09-22

100
推荐指数

3
解决办法

11万
查看次数

除Graphite之外的statsd数据的GUI？

我刚安装了石墨/ statsd用于生产用途.我真的很高兴,但我的一位同事问我是否有办法让它看起来更漂亮.老实说,我不能说我也不奇怪.

有没有替代Graphite UI可以更好地渲染数据,可能使用了一个很棒的前端图形库和http推送？

metrics data-visualization graphite

Bla*_*lor

2014 09-24

90
推荐指数

5
解决办法

5万
查看次数

如何在远程服务器上运行Tensorboard？

我是Tensorflow的新手,可以从我正在做的一些可视化中获益.我知道Tensorboard是一个有用的可视化工具,但我如何在远程Ubuntu机器上运行它？

data-visualization machine-learning remote-access tensorflow tensorboard

use*_*ser

2019 04-22

85
推荐指数

10
解决办法

7万
查看次数

在matplotlib条形图上添加值标签

我被困在一些感觉应该相对容易的事情上.我下面的代码是基于我正在研究的更大项目的示例.我没有理由发布所有细节,所以请接受我带来的数据结构.

基本上,我正在创建一个条形图,我只是想弄清楚如何在条形图上添加值标签(在条形图的中心,或者在它上面).一直在寻找网络上的样本,但没有成功实现我自己的代码.我相信解决方案要么是'text',要么是'annotate',但是我:a)不知道使用哪一个(一般来说,还没弄清楚何时使用哪个).b)无法看到要么呈现价值标签.非常感谢您的帮助,我的代码如下.提前致谢!

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
pd.set_option('display.mpl_style', 'default') 
%matplotlib inline

# Bring some raw data.
frequencies = [6, 16, 75, 160, 244, 260, 145, 73, 16, 4, 1]

# In my original code I create a series and run on that, 
# so for consistency I create a series from the list.
freq_series = pd.Series.from_array(frequencies)

x_labels = [108300.0, 110540.0, 112780.0, 115020.0, 117260.0, 119500.0, 
            121740.0, 123980.0, 126220.0, 128460.0, 130700.0]

# Plot the figure. …

Run Code Online (Sandbox Code Playgroud)

python data-visualization matplotlib python-2.7 pandas

Opt*_*esh

2018 03-19

74
推荐指数

5
解决办法

13万
查看次数