如何在 VSCode Jupyter Notebook 变量检查器中正确显示 Polars 数据框

Rap*_*ael 8 jupyter visual-studio-code python-polars

编辑:这已在 Polars 存储库中作为错误提交: https: //github.com/pola-rs/polars/issues/6152
和 VSCode Jupyter 存储库: https: //github.com/microsoft/vscode-jupyter/问题/12519


我正在 VSCode 中的 Jupyter 笔记本中测试 Python-Polars。

当我从变量视图打开数据框时,它的格式不正确。

它显示如下: 在此输入图像描述

列和行交换,并且列名称丢失。

我希望显示类似于 pandas 数据框的显示,如下所示: 在此输入图像描述

如何使 Polars 数据框正确显示?

dat*_*.ai 4

更新(2023-08-23):最新版本的 VSCode 将自动调用 to_pandas,您不再需要别名。


DataFrameVSCode 将尝试在数据查看器中显示具有类型名称的变量。它不会检查完全限定名称,并会尝试以polars.DataFramepandas.DataFrame.

请参阅: https: //github.com/microsoft/vscode-jupyter/blob/main/pythonFiles/vscode_datascience_helpers/getJupyterVariableDataFrameInfo.py

如果 DataFrame 存在,它将尝试调用在 DataFrame 上命名的方法toPandas(在极坐标的情况下则不存在)。

要么 VSCode 获得对极坐标的适当支持,要么极坐标必须实现该toPandas方法。

但是,由于 Polars 已经有一个方法,to_pandas您可以为其创建一个别名,它将按预期显示。

import polars as pl
df = pl.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
df.toPandas = df.to_pandas
Run Code Online (Sandbox Code Playgroud)

显示 pl.DataFrame 的正确列名称的数据查看器的屏幕截图