小编mor*_*ens的帖子

获取numpy数组中重复元素的所有索引的列表

我试图在numpy数组中得到所有重复元素的索引,但我现在发现的解决方案对于大型(> 20000个元素)输入数组来说是非常低效的(它需要大约9秒钟).这个想法很简单:

records_array是一个numpy时间戳数组(timedate),我们要从中提取重复时间戳的索引
time_array 是一个numpy数组,包含重复的所有时间戳 records_array
records是一个包含一些Record对象的django QuerySet(可以很容易地转换为列表).我们想要创建一个由Record的tagId属性的所有可能组合形成的对的列表,对应于从中找到的重复时间戳records_array.

这是我目前的工作(但效率低下)代码:

tag_couples = [];
for t in time_array:
    users_inter = np.nonzero(records_array == t)[0] # Get all repeated timestamps in records_array for time t
    l = [str(records[i].tagId) for i in users_inter] # Create a temporary list containing all tagIds recorded at time t
    if l.count(l[0]) != len(l): #remove tuples formed by the first tag repeated
        tag_couples +=[x for x in itertools.combinations(list(set(l)),2)] # Remove duplicates with list(set(l)) and append all …

Run Code Online (Sandbox Code Playgroud)

python arrays django numpy

mor*_*ens

lucky-day

9
推荐指数

2
解决办法

1万
查看次数