假设我有一个这样的数据帧
A B
0 a b
1 c d
2 e f
3 g h
Run Code Online (Sandbox Code Playgroud)
0,1,2,3是次,a,c,e,g是一个时间序列,b,d,f,h是另一个时间序列.我需要能够在orignal数据帧中添加两列,这是通过计算某些列的连续行的差异得到的.
所以我需要这样的东西
A B dA
0 a b (a-c)
1 c d (c-e)
2 e f (e-g)
3 g h Nan
Run Code Online (Sandbox Code Playgroud)
我在数据帧/系列上看到了一些叫做diff的东西,但是它的含义略有不同,因为在第一个元素中会变成Nan.
试图了解一些熊猫特征背后的设计理念.
如果我有一个包含3560行和18列的DataFrame,那么
len(frame)
Run Code Online (Sandbox Code Playgroud)
是3560,但是
len([a for a in frame])
Run Code Online (Sandbox Code Playgroud)
是18岁.
也许这对来自R的人来说很自然; 对我而言,它并不像'Pythonic'.Pandas的基础设计理念是否有介绍?