小编Oct*_*nWR的帖子

在 Dask Dataframe 中使用扩展拆分 Str

我有 3400 万行,只有一列。我想将字符串拆分为 4 列。

这是我的示例数据集 (df):

    Log
0   Apr  4 20:30:33 100.51.100.254 dns,packet user: --- got query from 10.5.14.243:30648:
1   Apr  4 20:30:33 100.51.100.254 dns,packet user: id:78a4 rd:1 tc:0 aa:0 qr:0 ra:0 QUERY 'no error'
2   Apr  4 20:30:33 100.51.100.254 dns,packet user: question: tracking.intl.miui.com:A:IN
3   Apr  4 20:30:33 dns user: query from 9.5.10.243: #4746190 tracking.intl.miui.com. A
Run Code Online (Sandbox Code Playgroud)

我想使用以下代码将其拆分为四列:

df1 = df['Log'].str.split(n=3, expand=True)
df1.columns=['Month','Date','Time','Log']
df1.head()
Run Code Online (Sandbox Code Playgroud)

这是我预期的结果

     Month Date      Time                                              Log
0      Apr    4  20:30:33  100.51.100.254 dns,packet user: --- go...
1      Apr …
Run Code Online (Sandbox Code Playgroud)

python string split bigdata dask

2
推荐指数
1
解决办法
1284
查看次数

标签 统计

bigdata ×1

dask ×1

python ×1

split ×1

string ×1