小编Hum*_*194的帖子

在 Polars groupby 聚合中,如何连接每个组中的字符串值?

在 Python 中对 Polars 数据框进行分组时,如何将单个列中的字符串值跨每个组中的行连接起来?

\n

例如,给定以下 DataFrame:

\n
import polars as pl\n\ndf = pl.DataFrame(\n    {\n        "col1": ["a", "b", "a", "b", "c"],\n        "col2": ["val1", "val2", "val1", "val3", "val3"]\n    }\n)\n
Run Code Online (Sandbox Code Playgroud)\n

原始 df:

\n
shape: (5, 2)\n\xe2\x94\x8c\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xac\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x90\n\xe2\x94\x82 col1 \xe2\x94\x86 col2 \xe2\x94\x82\n\xe2\x94\x82 ---  \xe2\x94\x86 ---  \xe2\x94\x82\n\xe2\x94\x82 str  \xe2\x94\x86 str  \xe2\x94\x82\n\xe2\x95\x9e\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xaa\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\xa1\n\xe2\x94\x82 a    \xe2\x94\x86 val1 \xe2\x94\x82\n\xe2\x94\x82 b    \xe2\x94\x86 val2 \xe2\x94\x82\n\xe2\x94\x82 a    \xe2\x94\x86 val1 \xe2\x94\x82\n\xe2\x94\x82 b    \xe2\x94\x86 val3 \xe2\x94\x82\n\xe2\x94\x82 c    \xe2\x94\x86 val3 \xe2\x94\x82\n\xe2\x94\x94\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xb4\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x98\n
Run Code Online (Sandbox Code Playgroud)\n

我想运行 groupby 操作,例如:

\n
shape: (5, 2)\n\xe2\x94\x8c\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xac\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x90\n\xe2\x94\x82 col1 \xe2\x94\x86 col2 \xe2\x94\x82\n\xe2\x94\x82 …
Run Code Online (Sandbox Code Playgroud)

python-polars

4
推荐指数
1
解决办法
1963
查看次数

标签 统计

python-polars ×1