小编Yok*_*oko的帖子

删除*几乎*重复的观察 - Python

我试图删除 Pandas DataFrame 中的一些观察结果,其中相似性几乎为 100%,但不完全相同。见下图:

在此处输入图片说明

请注意“John”、“Mary”和“Wesley”的观察结果几乎相同,但有一列不同。真实数据集有 15 列,以及 215,000 多个观测值。在我可以目视验证的所有情况下,相似之处同样是:在 15 列中,其他观察结果每次最多匹配 14 列。出于该项目的目的,我决定删除重复的观察结果(并将它们存储到另一个 DataFrame 中,以防我的老板要求查看它们)。

我显然已经想到了remove_duplicates(keep='something'),但这行不通,因为观察结果并不完全相似。有没有人遇到过这样的问题?关于补救措施的任何想法?

python duplicates pandas

5
推荐指数
1
解决办法
345
查看次数

使用 lambda 的阶乘函数

我正在尝试将下面的函数实现为一行 lambda 代码。

def fac(num):
    num = int(num)
    if num > 1:
        return num * fac(num - 1)
    else:
        return 1
Run Code Online (Sandbox Code Playgroud)

我已经构建了一个 lambda 语句,但我不断收到语法错误:

z = lambda z: if (z > 1) z * (z-1) else 1
Run Code Online (Sandbox Code Playgroud)

python lambda

4
推荐指数
1
解决办法
148
查看次数

Python 2.7的操作顺序

自学编码,这行代码的操作顺序是什么?

print 3 + 2 + 1 - 5 + 4 % 2 - 1 / 4 + 6
Run Code Online (Sandbox Code Playgroud)

我尝试先进行余数和除法,所以我得到3 + 2 + 1-5 + 0-0.25 / 4 +6。然后我从左到右完成了AS,得到0.075。完全错误,因为LPTHW将其设置为7。请提供详细的操作顺序。

我用Google搜索了Python的操作顺序,但是结果并没有太有启发性。

print 3 + 2 + 1 - 5 + 4 % 2 - 1 / 4 + 6
Run Code Online (Sandbox Code Playgroud)

预期结果为7,但获得0.075

python

1
推荐指数
1
解决办法
70
查看次数

标签 统计

python ×3

duplicates ×1

lambda ×1

pandas ×1