小编Ale*_*osa的帖子

如何在字符串之间选择值并使用python中的regex放置在数据框的列中

我有一个包含标题为"评论"的列的大型数据框

在评论部分我需要提取3个值并放入单独的列中,即(占空比,气体和压力)

"数据采集START占空比:0,气体:真空压力:0.000028 Torr"

目前我使用.split和.tolist来解析字符串 - >

#split string and sort into columns 
df1 = pd.DataFrame(eventsDf.comment.str.split().tolist(),columns="0 0 0 0 0 0 dutyCycle 0 Gas 0 Pressure 0 ".split())

#join dataFrames
eventsDf = pd.concat([eventsDf, df1], axis=1)

#drop columns not needed
eventsDf.drop(['comment','0',],axis=1,inplace=True)
Run Code Online (Sandbox Code Playgroud)

我发现这个方法相当"hacky",因为如果注释部分的结构发生变化,我的代码就会变得无用......有人能告诉我一个更有效/更强大的方法来做这个吗?非常感谢!

python regex dataframe pandas

5
推荐指数
1
解决办法
65
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1

regex ×1