按列表过滤熊猫数据框

Question

按列表过滤熊猫数据框

Cal*_*arJ 2 python numpy pandas data-science

我有一个数据框，其中有一行名为“Hybridization REF”。我想进行过滤，以便只获取与列表中的项目之一具有相同标签的项目的数据。

基本上，我想做以下事情：

dataframe[dataframe["Hybridization REF'].apply(lambda: x in list)]

Run Code Online (Sandbox Code Playgroud)

但该语法不正确。

Answer 1

小智 11

有 numpy 数据框吗？我猜它是 pandas 数据框，如果是这样，这就是解决方案。

df[df['Hybridization REF'].isin(list)]

Run Code Online (Sandbox Code Playgroud)

Answer 2

小智 7

假设 df是你的dataframe， lst是我们list的标签。

df.loc[ df.index.isin(lst), : ]

Run Code Online (Sandbox Code Playgroud)

将显示其索引与列表项的任何值匹配的所有行。我希望这有助于解决您的查询。

Answer 3

Sco*_*ton 4

使用重新索引更新，

df.reindex(collist, axis=1)

Run Code Online (Sandbox Code Playgroud)

和

df.reindex(rowlist, axis=0)

Run Code Online (Sandbox Code Playgroud)

以及两者：

df.reindex(index=rowlist, columns=collist)

Run Code Online (Sandbox Code Playgroud)

您可以使用 .loc 或列过滤：

df = pd.DataFrame(data=np.random.rand(5,5),columns=list('ABCDE'),index=list('abcde'))

df
          A         B         C         D         E
a  0.460537  0.174788  0.167554  0.298469  0.630961
b  0.728094  0.275326  0.405864  0.302588  0.624046
c  0.953253  0.682038  0.802147  0.105888  0.089966
d  0.122748  0.954955  0.766184  0.410876  0.527166
e  0.227185  0.449025  0.703912  0.617826  0.037297

collist = ['B','D','E']

rowlist = ['a','c']

Run Code Online (Sandbox Code Playgroud)

获取列表中的列：

df[collist]

Run Code Online (Sandbox Code Playgroud)

输出：

          B         D         E
a  0.174788  0.298469  0.630961
b  0.275326  0.302588  0.624046
c  0.682038  0.105888  0.089966
d  0.954955  0.410876  0.527166
e  0.449025  0.617826  0.037297

Run Code Online (Sandbox Code Playgroud)

获取列表中的行

df.loc[rowlist]

          A         B         C         D         E
a  0.460537  0.174788  0.167554  0.298469  0.630961
c  0.953253  0.682038  0.802147  0.105888  0.089966

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，10 月前
查看次数：	12705 次
最近记录：	6 年，1 月前