AB_col = [(0,230), (10,215), (15, 200), (20, 185), (40, 177),
(0,237), (10,222), (15, 207), (20, 192), (40, 184)]
sales = [{'account': 'Jones LLC', 'A': 0, 'B': 230, 'C': 140},
{'account': 'Alpha Co', 'A': 20, 'B': 192, 'C': 215},
{'account': 'Blue Inc', 'A': 50, 'B': 90, 'C': 95 }]
df = pd.DataFrame(sales)
print df
Run Code Online (Sandbox Code Playgroud)
现在,上面的数据帧必须由AB_col元组列表进行过滤.我试过类似的东西
df[df["A","B"].zip.isin(AB_col)]
Run Code Online (Sandbox Code Playgroud)
但它不起作用,如何将上述数据帧过滤到如下所示的数据帧
您需要创建Series的tuples:
df = df[df[["A","B"]].apply(tuple, 1).isin(AB_col)]
Run Code Online (Sandbox Code Playgroud)
替代方案:
df = df[pd.Series(list(zip(df.A, df.B)), index=df.index).isin(AB_col)]
Run Code Online (Sandbox Code Playgroud)
或者你可以比较MultiIndex创建者set_index:
df = df[df.set_index(['A','B']).index.isin(AB_col)]
Run Code Online (Sandbox Code Playgroud)
print (df)
A B C account
0 0 230 140 Jones LLC
1 20 192 215 Alpha Co
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1873 次 |
| 最近记录: |