使用pandas/python,我想计算每组元组的最长递增子序列DTE
,但有效地使用13M行。现在,使用 apply/iteration 大约需要 10 个小时。
这大概是我的问题:
DTE | 罢工 | 出价 | 问 |
---|---|---|---|
1 | 100 | 10 | 11 |
1 | 200 | 16 | 17 |
1 | 300 | 17 | 18 |
1 | 400 | 11 | 12 |
1 | 500 | 12 | 13 |
1 | 600 | 13 | 14 |
2 | 100 | 10 | 30 |
2 | 200 | 15 | 20 |
2 | 300 | 16 | 21 |
import pandas as pd
pd.DataFrame({
'DTE': [1,1,1,1,1,1,2,2,2],
'Strike': [100,200,300,400,500,600,100,200,300],
'Bid': [10,16,17,11,12,13,10,15,16],
'Ask': [11,17,18,12,13,14,30,20,21],
})
Run Code Online (Sandbox Code Playgroud)
我想要:
DTE
。这里我们有两个组(DTE 1 和 DTE 2)。然后在每个组内...Strike
,它对于每个 DTE 组都是唯一的。所以 200 Strike 是在 100 …python vectorization quantitative-finance pandas subsequence