从 Pandas DataFrame 中提取符合条件的单元格索引

com*_*pos 3 python indexing dataframe pandas

我在 Pandas 中有一个 DataFrame,如下所示:

  a b c
A 1 2 3 
B 4 5 6
C 7 8 9
Run Code Online (Sandbox Code Playgroud)

我想提取单元格值大于 6 的索引名称和列名称对。

换句话说,我想获得

[["B","c"], ["C","a"], ["C","b"], ["C","c"]]
Run Code Online (Sandbox Code Playgroud)

有什么聪明的方法可以做到这一点吗?

DSM*_*DSM 6

您可以使用stack将框架展平为一个系列,使用布尔索引来选择您想要的术语,最后将结果索引转换为列表:

s = df.stack()
ii = s[s >= 6].index.tolist()
Run Code Online (Sandbox Code Playgroud)

例如:

>>> s = df.stack()
>>> s
A  a    1
   b    2
   c    3
B  a    4
   b    5
   c    6
C  a    7
   b    8
   c    9
dtype: int64
>>> s[s >= 6]
B  c    6
C  a    7
   b    8
   c    9
dtype: int64
>>> s[s >= 6].index
MultiIndex(levels=[[u'A', u'B', u'C'], [u'a', u'b', u'c']],
           labels=[[1, 2, 2, 2], [2, 0, 1, 2]])
>>> s[s >= 6].index.tolist()
[('B', 'c'), ('C', 'a'), ('C', 'b'), ('C', 'c')]
Run Code Online (Sandbox Code Playgroud)

请注意,(1)我使用>= 6它是因为它与您的示例相匹配,并且(2)这严格来说是一个元组列表,而不是您要求的列表列表,但是如果您真的想要,您可以进行转换。