RBR*_*RBR 0 python regex pandas
我有以下数据:
#1314515 22-09-2021
并且只需要提取数字而不是日期,如下所示:
1314515
已尝试以下正则表达式组合但不起作用:
[\s0-9]+
\s[0-9]+
Run Code Online (Sandbox Code Playgroud)
请帮忙正确组合。
使用正则表达式和pd.Series.str.extract
:
df['col'] = df['col'].str.extract('(\d+)(?=\s)')
Run Code Online (Sandbox Code Playgroud)
转换为整数:
df['col'] = df['col'].str.extract('(\d+)(?=\s)').astype(int)
Run Code Online (Sandbox Code Playgroud)
解释。