小编sar*_*sky的帖子

如何在 Pandas DataFrame 中将可变大小的基于字符串的列拆分为多列?

我有一个 Pandas DataFrame,其形式如下:

A      B       C     D
A1     6       7.5   NaN
A1     4       23.8  <D1 0.0 6.5 12 4, D2 1.0 4 3.5 1>
A2     7       11.9  <D1 2.0 7.5 10 2, D3 7.5 4.2 13.5 4> 
A3    11       0.8   <D2 2.0 7.5 10 2, D3 7.5 4.2 13.5 4, D4 2.0 7.5 10 2, D5 7.5 4.2 13.5 4>
Run Code Online (Sandbox Code Playgroud)

D列是一个原始字符串列,每个条目中有多个类别。条目的值是通过将每个类别的最后两个值相除来计算的。例如,在第二行:

D1 = 12/4 = 3
D2 = 3.5/1 = 3.5
Run Code Online (Sandbox Code Playgroud)

我需要根据它的类别拆分D列并将它们加入我的 DataFrame。问题是该列是动态的,在一个条目中可以有近 35-40 个类别。目前,我所做的只是迭代所有行的蛮力方法,这对于大型数据集来说非常慢。有人可以帮帮我吗? …

python dataframe pandas

5
推荐指数
1
解决办法
120
查看次数

标签 统计

dataframe ×1

pandas ×1

python ×1