我的问题涉及在多索引级别的分区内调用.diff()
在下面的示例中输出第一个
df.diff()是
values
Greek English
alpha a NaN
b 2
c 2
d 2
beta e 11
f 1
g 1
h 1
Run Code Online (Sandbox Code Playgroud)
但我希望它是:
values
Greek English
alpha a NaN
b 2
c 2
d 2
beta e NaN
f 1
g 1
h 1
Run Code Online (Sandbox Code Playgroud)
这是一个解决方案,使用循环,但我想我可以避免这个循环!
import pandas as pd
import numpy as np
df = pd.DataFrame({'values' : [1.,3.,5.,7.,18.,19.,20.,21.],
'Greek' : ['alpha', 'alpha', 'alpha', 'alpha','beta','beta','beta','beta'],
'English' : ['a', 'b', 'c', 'd','e','f','g','h']})
df.set_index(['Greek','English'],inplace =True)
print df
# (1.) …Run Code Online (Sandbox Code Playgroud)