在Python或NumPy中,找出第一次出现的子阵列的最佳方法是什么?
例如,我有
a = [1, 2, 3, 4, 5, 6]
b = [2, 3, 4]
Run Code Online (Sandbox Code Playgroud)
找出b出现在哪里的最快方法(运行时间)是什么?我理解字符串这非常容易,但对于列表或numpy ndarray呢?
非常感谢!
[编辑]我更喜欢numpy解决方案,因为从我的经验来看,numpy矢量化比Python列表理解要快得多.同时,大数组是巨大的,所以我不想把它转换成字符串; 这将是(太长).
我有以下数组
a = [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7,0,10,11]
Run Code Online (Sandbox Code Playgroud)
我希望找到连续值为零的数组的开始和结束索引,对于输出上方的数组,如下所示
[3,8],[12,15],[19]
Run Code Online (Sandbox Code Playgroud)
我想尽可能高效地做到这一点.
背景
我有一个用零初始化的1D NumPy数组.
import numpy as np
section = np.zeros(1000)
Run Code Online (Sandbox Code Playgroud)
然后我有一个Pandas DataFrame,其中我有两列索引:
d= {'start': {0: 7200, 1: 7500, 2: 7560, 3: 8100, 4: 11400},
'end': {0: 10800, 1: 8100, 2: 8100, 3: 8150, 4: 12000}}
df = pd.DataFrame(data=d, columns=['start', 'end'])
Run Code Online (Sandbox Code Playgroud)
对于每对索引,我想将numpy数组中相应索引的值设置为True.
我目前的解决方案
我可以通过将函数应用于DataFrame来实现:
def fill_array(row):
section[row.start:row.end] = True
df.apply(fill_array, axis=1)
Run Code Online (Sandbox Code Playgroud)
我想矢量化这个操作
这正如我所料,但为了它的乐趣,我想矢量化操作.我对此并不十分熟悉,而且我在线搜索并没有让我走上正轨.
如果可能的话,我真的很感激有关如何将其转换为矢量操作的任何建议.