cod*_*ous 5 physics pandas data-science python-3.7
n_level = range(1, steps + 2)
Run Code Online (Sandbox Code Playgroud)
steps是用户输入,使用多索引数据框
df = {'crest': [754, 755, 762, 785], 'trough': [752, 725, 759, 765], 'L1T': [761, 761, 761, 761], 'L2T': [772, 772, 772, 772], 'L3T': [783, 783, 783, 783], 'L4T': [794, 794, 794, 794], 'L1M': [740, 740, 740, 740], 'L2M': [729, 729, 729, 729], 'L3M': [718, 718, 718, 718], 'L4T': [707, 707, 707, 707]}
for i in n_level:
if df['Crest'] >= df[f'L{i}T']:
df['Marker'] = i
elif df['Trough'] <= df[f'L{i}M']:
df['Marker'] = -i
else:
df['Marker'] = 0
Run Code Online (Sandbox Code Playgroud)
我期待低于 df 的 col 标记
df = {'crest': [754, 755, 762, 785], 'trough': [752, 725, 759, 765], 'L1T': [761, 761, 761, 761], 'L2T': [772, 772, 772, 772], 'L3T': [783, 783, 783, 783], 'L4T': [794, 794, 794, 794], 'L1M': [740, 740, 740, 740], 'L2M': [729, 729, 729, 729], 'L3M': [718, 718, 718, 718], 'L4T': [707, 707, 707, 707], 'Marker': [0, -2, 1, 3]},
Run Code Online (Sandbox Code Playgroud)
if 语句返回 True 或 False,使用它我们可以将其转换为第 i 个值 (+/-)
我需要的是另一个 col df['Marker'],它将测量波峰或波谷是否穿过 L{i}T 或 L{i}M,在波峰或波谷向下突破的情况下,测量上行的任何突破口低谷的情况
这可以使用二分搜索轻松实现,有很多方法可以应用它(NumPy、bisect)。我会推荐图书馆二等分。
为波峰添加了 Buu,为波谷添加了 See,以便对片段进行编码和区分。你可以选择任何东西
def marker_up(row):
n_row = [row[col] for col in columns if "Buu" in col]
n_high = row['Crest']
if n_high in n_row:
q = bs.bisect_left(n_row, n_high)
q = max(0, q)
return q
else:
q_mod = bs.bisect_left(n_row, n_high)
q_mod -= 1
q_mod = max(0, q_mod)
return q_mod
Marker_up = df.apply(marker_up, axis=1)
def marker_down(row):
n_row = [row[col] for col in columns if "See" in col]
n_low = row['Trough']
if n_low in n_row:
q = bs.bisect_left(n_row, n_low)
q = q - len(n_row)
return q
else:
q_mod = bs.bisect_left(n_row, n_low)
q_mod = q_mod - len(n_row)
return q_mod
Marker_down = df.apply(marker_down, axis=1)
df['Marker'] = Marker_up + Marker_down
return df
Run Code Online (Sandbox Code Playgroud)
如果 df 较大,请勿使用 iloc、dict 或 iterrrows。矢量化形式将有助于更快地运行代码。