'subset'不适用于drop_duplicates pandas dataframe

Question

'subset'不适用于drop_duplicates pandas dataframe

una*_*tis 6 python duplicates dataframe pandas

我有一个看起来像这样的df:

    A                B    C               D     NEW
0   1       Adhoc_Task  WID          WI_DTL      []  
1   1  Arun_adhoc_load  ATT           IXN_1  (IXN,)
2   1  Arun_adhoc_load  ATT          IXN_10  (IXN,)
3   1  Arun_adhoc_load  ATT         IXN_100  (IXN,)
4   1  Arun_adhoc_load  ATT         IXN_101  (IXN,)
5   2    Batch_Support  ATT      CDS_STATUS      []
6   2    Batch_Support  ATT     CDS_CONTROL      []
7   2    Batch_Support  ATT  CDS_ORA_STATUS      []
8   2    Batch_Support  ATT      REP_FILTER      []
9   1      online_load  ATT           TAX_3  (TAX,)
10  1      online_load  ATT           TAX_4  (TAX,)
11  1      online_load  ATT           TAX_8  (TAX,)
12  1      online_load  ATT          TAX_11  (TAX,)

Run Code Online (Sandbox Code Playgroud)

期望的输出将如下所示:

    A                B    C               D     NEW
0   1       Adhoc_Task  WID          WI_DTL      []  
1   1  Arun_adhoc_load  ATT           IXN_1  (IXN,)
5   2    Batch_Support  ATT      CDS_STATUS      []
9   1      online_load  ATT           TAX_3  (TAX,)

Run Code Online (Sandbox Code Playgroud)

我试图根据B列删除重复行.但是,当我运行时

df.drop_duplicates(subset = ['B'], keep='first', inplace=True)

Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

TypeError: drop_duplicates() got an unexpected keyword argument 'subset'

Run Code Online (Sandbox Code Playgroud)

我从python 3运行pandas 0.19.1,所以我看了一下这里的文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html

我的错误并不是最糟糕的subset.如何根据一列中的值从DataFrame中删除重复项？

Answer 1

Bou*_*oud 13

无论出于何种原因,代码中的df都成为了Series对象.type(df)在失败的drop_duplicates电话之前检查.该函数subset对该系列没有任何论据.

归档时间：	9 年，3 月前
查看次数：	6020 次
最近记录：	9 年，3 月前