我有一个time column这样的:
df = pd.DataFrame({'time': {0: '1 h 50 min', 1: '50 min', 2: '2 h 3 min', 3: '3 min'}})
Run Code Online (Sandbox Code Playgroud)
time
0 1 h 50 min
1 50 min
2 2 h 3 min
3 3 min
Run Code Online (Sandbox Code Playgroud)
我想要几秒钟的信息,例如:
time
6600
3000
7380
180
Run Code Online (Sandbox Code Playgroud)
我试图使用regex并eval以秒为单位评估时间,但没有成功实现这一目标的最佳方法是什么?
我有一个这样的数据框:
part part_parent
0 part1 NaN
1 part2 part1
2 part3 part2
3 part4 part3
4 part5 part2
Run Code Online (Sandbox Code Playgroud)
我需要像这样添加一个额外的列层次结构:
part part_parent hierarchy
0 part1 NaN part1
1 part2 part1 part1/part2/
2 part3 part2 part1/part2/part3/
3 part4 part3 part1/part2/part3/part4
4 part5 part2 part1/part2/part5
Run Code Online (Sandbox Code Playgroud)
字典创建输入/输出数据帧:
from numpy import nan
df1 = pd.DataFrame({'part': {0: 'part1', 1: 'part2', 2: 'part3', 3: 'part4', 4: 'part5'},
'part_parent': {0: nan, 1: 'part1', 2: 'part2', 3: 'part3', 4: 'part2'}})
df2 = pd.DataFrame({'part': {0: 'part1', 1: 'part2', 2: 'part3', …Run Code Online (Sandbox Code Playgroud)