小编Sla*_*voj的帖子

如何使用 pandas query() 在查询表达式中正确引用多索引列标题?

使用简单的(单级)列索引,可以使用 .query() 访问 Pandas DataFrame 中的列,如下所示:

df1 = pd.DataFrame(np.random.rand(10,2),index=range(10),columns=['A','B'])
df1.query('A > 0.5')
Run Code Online (Sandbox Code Playgroud)

我正在努力在具有列多索引的 DataFrame 中实现类比:

df2 = pd.DataFrame(np.random.rand(10,2),index=range(10),columns=[['A','B'],['C','D']])
df2.query('(A,C) > 0.5') # fails
df2.query('"(A,C)" > 0.5') # fails
df2.query('("A","C") > 0.5') # fails
Run Code Online (Sandbox Code Playgroud)

这是可行的吗?谢谢...

(至于动机:query() 似乎允许在行多索引 - 列单索引数据帧上进行非常简洁的选择,例如:

df3 = pd.DataFrame(np.random.rand(6,2),index=[[0]*3+[1]*3,range(2,8)],columns=['A','B'])
df3.index.names=['one','two']
df3.query('one==0 & two<4 & A>0.5')
Run Code Online (Sandbox Code Playgroud)

我想对两个轴上的 DF 多索引做类似的事情......)

python pandas

7
推荐指数
1
解决办法
629
查看次数

标签 统计

pandas ×1

python ×1