在每7行中,获得第n行pandas

Question

在每7行中,获得第n行pandas

我有一个df这样的大约1000行:

      0        1
0  1.345    2.456
1  2.123    3.564
2  0.023    3.548
3  3.457    2.456
4  1.754    3.564
5  0.905    3.548
6  3.674    7.543
7  9.443    6.4433...

Run Code Online (Sandbox Code Playgroud)

它的组织方式是每7行构成一组"数据"(数据不能在这里排序).在7行的每个"组"中,我想获得第一行,所以我的新数据框看起来像:

      0        1
0  1.345    2.456
7  9.443    6.4433

Run Code Online (Sandbox Code Playgroud)

我可以通过创建一个重复1-7并仅按该列过滤的新列来解决它...

      0        1    groupby_col
0  1.345    2.456        1
1  2.123    3.564        2
2  0.023    3.548        3
3  3.457    2.456        4
4  1.754    3.564        5
5  0.905    3.548        6
6  3.674    7.543        7
7  9.443    6.4433       1...

Run Code Online (Sandbox Code Playgroud)

然后...

df[df['groupby_col'] == 1]

Run Code Online (Sandbox Code Playgroud)

我有没有办法在熊猫中做到这一点,而无需创建额外的列然后过滤？

Answer 1

Max*_*axU 5

选项1:

In [54]: df.iloc[::7]
Out[54]:
       0       1
0  1.345  2.4560
7  9.443  6.4433

Run Code Online (Sandbox Code Playgroud)

选项2:

In [53]: df.iloc[np.arange(len(df))%7==0]
Out[53]:
       0       1
0  1.345  2.4560
7  9.443  6.4433

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，4 月前
查看次数：	460 次
最近记录：	8 年，4 月前