小编Yok*_*oko的帖子

删除几乎重复的观察 - Python

我试图删除 Pandas DataFrame 中的一些观察结果，其中相似性几乎为 100%，但不完全相同。见下图：

请注意“John”、“Mary”和“Wesley”的观察结果几乎相同，但有一列不同。真实数据集有 15 列，以及 215,000 多个观测值。在我可以目视验证的所有情况下，相似之处同样是：在 15 列中，其他观察结果每次最多匹配 14 列。出于该项目的目的，我决定删除重复的观察结果（并将它们存储到另一个 DataFrame 中，以防我的老板要求查看它们）。

我显然已经想到了remove_duplicates(keep='something')，但这行不通，因为观察结果并不完全相似。有没有人遇到过这样的问题？关于补救措施的任何想法？

python duplicates pandas

Yok*_*oko

2021 05-08

5
推荐指数

1
解决办法

345
查看次数

使用 lambda 的阶乘函数

我正在尝试将下面的函数实现为一行 lambda 代码。

def fac(num):
    num = int(num)
    if num > 1:
        return num * fac(num - 1)
    else:
        return 1

Run Code Online (Sandbox Code Playgroud)

我已经构建了一个 lambda 语句，但我不断收到语法错误：

z = lambda z: if (z > 1) z * (z-1) else 1

Run Code Online (Sandbox Code Playgroud)

python lambda

Yok*_*oko

lucky-day

4
推荐指数

1
解决办法

148
查看次数

Python 2.7的操作顺序

自学编码，这行代码的操作顺序是什么？

print 3 + 2 + 1 - 5 + 4 % 2 - 1 / 4 + 6

Run Code Online (Sandbox Code Playgroud)

我尝试先进行余数和除法，所以我得到3 + 2 + 1-5 + 0-0.25 / 4 +6。然后我从左到右完成了AS，得到0.075。完全错误，因为LPTHW将其设置为7。请提供详细的操作顺序。

我用Google搜索了Python的操作顺序，但是结果并没有太有启发性。

print 3 + 2 + 1 - 5 + 4 % 2 - 1 / 4 + 6

Run Code Online (Sandbox Code Playgroud)

预期结果为7，但获得0.075

python

Yok*_*oko

2019 08-04

1
推荐指数

1
解决办法

70
查看次数

标签统计

python ×3

duplicates ×1

lambda ×1

pandas ×1

删除*几乎*重复的观察 - Python

使用 lambda 的阶乘函数

Python 2.7的操作顺序

标签 统计

小编Yok_oko的帖子

删除几乎重复的观察 - Python

标签统计