小编J.S*_*.P.的帖子

在 Pandas 中,如何识别具有共同值的记录并替换其中一个的值以匹配另一个?

我有一个包含三列的熊猫数据框:

a          b          c
Donaldson  Minnesota  2020
Ozuna      Atlanta    2020
Betts      Boston     2019
Donaldson  Atlanta    2019
Ozuna      St. Louis  2019
Torres     New York   2019
Run Code Online (Sandbox Code Playgroud)

我想识别具有多个列 c 值的所有列名称,然后将所有列 b 实例替换为数据框中的第一个值,如下所示:

a          b          c
Donaldson  Minnesota  2020
Ozuna      Atlanta    2020
Betts      Boston     2019
Donaldson  Minnesota  2019
Ozuna      Atlanta    2019
Torres     New York   2019
Run Code Online (Sandbox Code Playgroud)

这绝对是低效的,但这是我迄今为止尝试过的:

# get a df of just names and cities and deduplicate

df_names = df[['a','b']].drop_duplicates()


# find any multiple column b values and put them in a list

a_matches …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

3
推荐指数
1
解决办法
38
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1