Mic*_*ter 2 dataframe python-2.7 pandas data-cleaning
我有一个名为 pandas 数据框df,其中包含几列和一df['MY STATE']列。我的目标是从数据框中删除不包含美国各州的所有行。我想通过将单元格中的值与包含所有状态缩写的 pandas 系列进行比较来做到这一点。我见过人们使用类似以下内容来清理数据框:
df = df[df['COST'] <= 0]
Run Code Online (Sandbox Code Playgroud)
但像我需要的东西(如下)不起作用
df = df[df['MY STATE'] not in states['Abbreviation'].values]
Run Code Online (Sandbox Code Playgroud)
有没有办法简单地做到这一点?
我读过df.query()可以用来做这样的事情,但我还没有找到一个例子,并且还读过df.query()当列名中有空格时不能使用。
谢谢你,
迈克尔
isinIIUC 您可以与逆运算符一起使用~:
df = df[~df['MY STATE'].isin(states['Abbreviation'].values)]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1867 次 |
| 最近记录: |