小编Ali*_*024的帖子

如何在 Pandas 数据框中重新排序字符串并插入新字符串

我有一个如下所示的数据框。数据类型Output为字符串。

ID  Output
1   ab 1, bc 2, ac 5, at 0, abc 0 
2   ab 0, ac 5, at 0
3   ac 5, bc 0, atn 0
Run Code Online (Sandbox Code Playgroud)

如您所见,第 2 行bc被跳过,而整体顺序保持不变。但是,在 row3 中,顺序不同。如何首先插入缺失的类别,然后重新排序数据框中的字符串?换句话说,我怎样才能得到一个看起来像这样的中间数据框:

ID  Output
1   ab 1, bc 2, ac 5,  at 0,  abc 0, atn  
2   ab 0, bc,   ac 5,  at 0, abc,   atn
3   ab,   bc 0, ac 5,  at,   abc,   atn 0
Run Code Online (Sandbox Code Playgroud)

所以最终我可以执行以下操作:

x = df['Output'].str.split(",",expand=True,)
x.columns = x.iloc[0, :].str.extract(r"^(.*)\s+")[0]
x …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

3
推荐指数
1
解决办法
63
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1