小编der*_*ers的帖子

在参数化泛型中,isinstance和issubclass中的mypy差异从python 3.5到3.6

在我从python 3.5升级到python 3.6之前,这个工作:

import typing
issubclass(list, typing.List[int])  # returns True
isinstance([1, 2 ,3], typing.List[int]) # returns True
Run Code Online (Sandbox Code Playgroud)

现在在python 3.6中,这两个都引发了以下异常:

TypeError: Parameterized generics cannot be used with class or instance checks
Run Code Online (Sandbox Code Playgroud)

这是新的预期行为还是错误?如果打算如何执行检查,上面的代码在python 3.6中进行?

python typing type-hinting python-3.x mypy

6
推荐指数
1
解决办法
1496
查看次数

熊猫根据差异列形成集群

我正在尝试使用 Pandas 根据表示时间(以秒为单位)的列中的差异来消除数据框中的一些近似重复项。例如:

import pandas as pd, numpy as np
df=pd.DataFrame([1200,1201,1233,1555,1650,5561,5562],columns=['Time'])
df['Dif']=df.Time.diff()
df['Coef']=np.random.rand(len(df))
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

所以我需要做的是检查每个组的时间值都在 2 秒内发生,选择 Coef 中具有最高值的组并丢弃其余的。所以在这个例子中,我会以某种方式将索引 0 和 1 组合在一起并丢弃索引 0(因为 df.Coef[0] < df.Coef 1)。

同样,索引 5、6 和 7 将被组合在一起,除索引 6 外的所有内容都将被丢弃。所以所需的输出将是 df.drop([0,5,7]):

在此处输入图片说明

我目前有一个 python while 循环算法来做到这一点,但数据帧可以包含数百万个索引,所以它太慢了。任何纯熊猫解决方案将不胜感激

python pandas

3
推荐指数
1
解决办法
1058
查看次数

标签 统计

python ×2

mypy ×1

pandas ×1

python-3.x ×1

type-hinting ×1

typing ×1