在IPython笔记本(Bokeh)中绘制大型数据集

Dyl*_*kby 7 python data-analysis ipython-notebook bokeh

我有一个大型数据集,我想在IPython笔记本中绘图.

我将~0.5GB .csv文件读入Pandas DataFrame使用read_csv,大约需要两分钟.然后我尝试绘制这些数据.

data = pd.read_csv('large.csv')
output_notebook()
p1 = figure()
p1.circle(data.index, data['myDataset'])
show(p1)
Run Code Online (Sandbox Code Playgroud)

我的浏览器旋转,并没有向我显示任何情节.我尝试过以下方法:

  1. output_file() 代替 output_notebook()
  2. 使用ColumnSource对象作为source参数的图形circle()
  3. 将我的数据下采样更易于管理.

Bokeh在其网站上声称提供"非常大或流式数据集的高性能交互".如何在没有计算机停止的情况下可视化这些大型数据集?

big*_*dot 8

问题太广泛,无法提供任何具体的代码建议.我很好奇你尝试的下采样的大小是多少.默认的HTML Canvas for Bokeh绝对可以容纳数万个圈子.有几个选择: