根据索引值的条件选择 Pandas DataFrame 中的行

Question

根据索引值的条件选择 Pandas DataFrame 中的行

假设我有以下多索引 DataFrame：

import pandas as pd
df = pd.DataFrame({'Index0':[0,1,2,3,4,5],'Index1':[100,200,300,400,500,600],'A':[5,2,5,8,1,2]})

Run Code Online (Sandbox Code Playgroud)

现在我想选择 Index1 小于 400 的所有行。如果 Index1 是常规列，每个人都知道它是如何工作的：

df[df['Index1'] < 400]

Run Code Online (Sandbox Code Playgroud)

因此，一种方法是reset_index执行选择，然后再次设置索引。这似乎很多余。

我的问题是：有没有办法直接做到这一点？当 DataFrame 有一个行多索引时如何做到这一点？

Answer 1

jez*_*ael 7

这里最简单的是使用query：

df1 = df.query('Index1 < 400')
print (df1)
               A
Index0 Index1   
0      100     5
1      200     2
2      300     5

Run Code Online (Sandbox Code Playgroud)

或者get_level_values对于选择级别MultiIndexwith boolean indexing：

df1 = df[df.index.get_level_values('Index1') < 400]

Run Code Online (Sandbox Code Playgroud)

详情：

print (df.index.get_level_values('Index1'))
Int64Index([100, 200, 300, 400, 500, 600], dtype='int64', name='Index1')

Run Code Online (Sandbox Code Playgroud)

如果级别没有按位置选择的名称，则查询使用ilevel_带有位置的特殊关键字：

df.index.names = [None, None]
print (df)
       A
0 100  5
1 200  2
2 300  5
3 400  8
4 500  1
5 600  2

df1 = df.query('ilevel_1 < 400')

df1 = df[df.index.get_level_values(1) < 400]
print (df1)
       A
0 100  5
1 200  2
2 300  5

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，8 月前
查看次数：	2549 次
最近记录：	7 年，8 月前