使用 iloc 选择列,具有单独的索引和范围

Hel*_*len 3 python multi-index dataframe pandas

我想知道为什么这一行返回“无效语法”,以及一次性选择隔离列和范围的正确语法是什么:

X = f1.iloc[:, [2,5,[10:19]]].values
Run Code Online (Sandbox Code Playgroud)

顺便说一句,同样的情况也发生在:

X = f1.iloc[:, [2,5,10:19]].values
Run Code Online (Sandbox Code Playgroud)

谢谢。

jez*_*ael 5

其次是正确的语法,只需要numpy.r_连接索引:

np.random.seed(2019)

f1 = pd.DataFrame(np.random.randint(10, size=(5, 25))).add_prefix('a')
print(f1)
   a0  a1  a2  a3  a4  a5  ...  a19  a20  a21  a22  a23  a24
0   8   2   5   8   6   8  ...    0    1    6    0    2    6
1   6   3   1   3   5   0  ...    4    8    1    0    6    1
2   8   2   3   0   9   2  ...    7    1    0    7    4    4
3   7   0   8   9   0   7  ...    3    0    8    6    0    2
4   7   3   2   4   9   9  ...    0    8    8    1    4    9

X = f1.iloc[:, np.r_[2,5,10:19]].values
print(X)
[[5 8 5 3 0 2 5 7 8 5 4]
 [1 0 2 9 8 3 7 7 7 0 3]
 [3 2 6 2 1 1 1 1 8 6 2]
 [8 7 7 8 0 5 7 4 1 1 4]
 [2 9 7 2 9 3 8 5 2 5 5]]
Run Code Online (Sandbox Code Playgroud)

也可以先将值转换为 numpy 数组,然后iloc就没有必要了:

X = f1.values[:, np.r_[2,5,10:19]]
print(X)
[[5 8 5 3 0 2 5 7 8 5 4]
 [1 0 2 9 8 3 7 7 7 0 3]
 [3 2 6 2 1 1 1 1 8 6 2]
 [8 7 7 8 0 5 7 4 1 1 4]
 [2 9 7 2 9 3 8 5 2 5 5]]
Run Code Online (Sandbox Code Playgroud)