小编mah*_*hna的帖子

对从大型数据集聚合的数据使用 Altair

我正在尝试对大型(300,000 条记录)时态数据集进行直方图计数。我现在只是尝试按月绘制直方图,只有 6 个数据点,但是使用 json 或 altair_data_server 存储执行此操作会使页面崩溃。使用纯 Altair 无法很好地处理这种情况吗?我当然可以在 Pandas 中进行预处理,但这破坏了 Altair 美妙的声明性。

如果是这样,这是 altair 缺少的功能还是超出范围?我了解到 vegalite 存储整个基础数据并在运行时应用转换,但似乎 altair 可以(并且可能确实)有一种方法来仅存储图表的相关数据。

alt.Chart(df).mark_bar().encode(
    x=alt.X('month(timestamp):T'),
    y='count()'
)
Run Code Online (Sandbox Code Playgroud)

python data-visualization data-science vega-lite altair

3
推荐指数
1
解决办法
2562
查看次数