Polars 相当于 pandas 因式分解

Mar*_*ang 1 python-polars

Polars 是否具有像pandas.factorize一样将字符串列编码为整数 (1, 2, 3) 的功能?

在极地文档中没有找到它

jqu*_*ous 5

也许您正在寻找密集排名分类类型。

\n
df = pl.DataFrame({"column": ["foo", "bar", "baz", "foo", "foo"]})\ndf.with_columns(rank = pl.col("column").rank("dense"))\n
Run Code Online (Sandbox Code Playgroud)\n
shape: (5, 2)\n\xe2\x94\x8c\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xac\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x90\n\xe2\x94\x82 column | rank \xe2\x94\x82\n\xe2\x94\x82 ---    | ---  \xe2\x94\x82\n\xe2\x94\x82 str    | u32  \xe2\x94\x82\n\xe2\x95\x9e\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xaa\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xa1\n\xe2\x94\x82 foo    | 3    \xe2\x94\x82\n\xe2\x94\x82 bar    | 1    \xe2\x94\x82\n\xe2\x94\x82 baz    | 2    \xe2\x94\x82\n\xe2\x94\x82 foo    | 3    \xe2\x94\x82\n\xe2\x94\x82 foo    | 3    \xe2\x94\x82\n\xe2\x94\x94\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xb4\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x98\n
Run Code Online (Sandbox Code Playgroud)\n