我有这样的数据框
df
col1 col2 col3
A black berry black
B green apple green
C red wine red
Run Code Online (Sandbox Code Playgroud)
我想从col2值中减去col3值,结果看起来像
df1
col1 col2 col3
A berry black
B apple green
C wine red
Run Code Online (Sandbox Code Playgroud)
如何使用pandas以有效的方式做到这一点
我有一个像这样的数据框:
df
col1 col2
1 A
3 B
6 A
10 C
Run Code Online (Sandbox Code Playgroud)
我想以这种方式从df上方创建一个数据帧,如果col1值不连续,它将使用下一个col1值创建另一行,而col2值将恰好是上述值。
我正在寻找的数据框应该是
df
col1 col2
1 A
2 A
3 B
4 B
5 B
6 A
7 A
8 A
9 A
10 C
Run Code Online (Sandbox Code Playgroud)
我可以使用简单的for循环来做到这一点,但是有没有什么pythonic方式可以使用pandas最有效地做到这一点?
我有两个数据框:
df1
col1 col2
8 A
12 C
20 D
df2
col1 col3
7 F
15 G
Run Code Online (Sandbox Code Playgroud)
我想将col1上的这两个数据帧合并,以使df2和df1中最接近的col1值合并到一行中。
最终的数据帧看起来像
df
col1 col2 col3
8 A F
12 C G
20 D NA
Run Code Online (Sandbox Code Playgroud)
我可以使用for循环并比较数字来执行此操作,但是执行时间将非常长。
有没有任何Python方式可以做到这一点,所以运行时间将减少。一些熊猫捷径可能是。
我有一个像这样的数据框:
df
col1 col2
1 10
2 15
4 12
5 23
6 11
8 32
9 12
11 32
2 23
3 21
4 12
6 15
9 12
10 32
Run Code Online (Sandbox Code Playgroud)
我想为col1的每个1、5和10值选择col2值。如果col1值不是1、5或10,请保留col2值,其中col1值最接近1,5或10
例如,最终的df如下所示:
df
col1 col2
1 10
5 23
11 32
2 23
6 15
10 32
Run Code Online (Sandbox Code Playgroud)
如何使用熊猫而不使用任何循环
我有一个这样的数据框:
df:
col1 col2
1 pqr
3 abc
2 pqr
4 xyz
1 pqr
Run Code Online (Sandbox Code Playgroud)
我发现有重复的值及其pqr.我想在pqr发生的地方添加1,2,3.我想要实现的最终数据框架是:
df1
col1 col2
1 pqr1
3 abc
2 pqr2
4 xyz
1 pqr3
Run Code Online (Sandbox Code Playgroud)
如何以有效的方式做到这一点
我有一个像这样的数据框:
df
col1 col2 col3 col4
A 12 34 XX
B 20 25 PP
B nan nan nan
nan P 54 nan
nan R nan nan
nan nan nan PQ
C D 32 SS
R S 32 RS
Run Code Online (Sandbox Code Playgroud)
如果col1值为null,我想添加其他列的所有值,直到在col1中找到notnull元素为止
我正在寻找的数据框应如下所示:
col1 col2 col3 col4
A 12 34 XX
B 20 25 PP
B PR 54 PQ
C D 32 SS
R S 32 RS
Run Code Online (Sandbox Code Playgroud)
如何使用python / pandas以最有效的方式做