小编ste*_*lli的帖子

熊猫在所有列中的行数都低于其他行

我有一个数据框，其中有很多行和数字列，例如：

A	乙	C	D
12	7	1	0
7	1	2	0
1	1	1	1
2	2	0	0

我需要通过删除具有所有值都较大的另一行的那些行来减小数据帧的大小。在前面的示例中，我需要删除最后一行，因为第一行的所有值都较大（如果出现重复行，我需要保留其中一个）。并返回这个：

A	乙	C	D
12	7	1	0
7	1	2	0
1	1	1	1

我的更快的解决方案如下：

    def complete_reduction(df, columns):
        def _single_reduction(row):
            df["check"] = True
            for col in columns:
                df["check"] = df["check"] & (df[col] >= row[col])
            drop_index.append(df["check"].sum() == 1)
        df = df.drop_duplicates(subset=columns)
        drop_index = []
        df.apply(lambda x: _single_reduction(x), axis=1)
        df = df[numpy.array(drop_index).astype(bool)]
        return df

Run Code Online (Sandbox Code Playgroud)

还有更好的想法吗？

更新：

在这里找到了一个新的解决方案 /sf/answers/4797026041/ …

python optimization pandas

ste*_*lli

2022 05-22

8
推荐指数

2
解决办法

620
查看次数