我有一个包含标题为"评论"的列的大型数据框
在评论部分我需要提取3个值并放入单独的列中,即(占空比,气体和压力)
"数据采集START占空比:0,气体:真空压力:0.000028 Torr"
目前我使用.split和.tolist来解析字符串 - >
#split string and sort into columns
df1 = pd.DataFrame(eventsDf.comment.str.split().tolist(),columns="0 0 0 0 0 0 dutyCycle 0 Gas 0 Pressure 0 ".split())
#join dataFrames
eventsDf = pd.concat([eventsDf, df1], axis=1)
#drop columns not needed
eventsDf.drop(['comment','0',],axis=1,inplace=True)
Run Code Online (Sandbox Code Playgroud)
我发现这个方法相当"hacky",因为如果注释部分的结构发生变化,我的代码就会变得无用......有人能告诉我一个更有效/更强大的方法来做这个吗?非常感谢!