如何将数据框中的一列转换为python中的二维数组

jas*_*son 7 python numpy dataframe pandas

我有一个包含观察到的数据的数据框:

import pandas as pd
d = {'ID': [0,1,2], 'Value': 
[[1,2,1],[5,4,6],[7,20,9]]}
df = pd.DataFrame(data=d)
Run Code Online (Sandbox Code Playgroud)

如何从值中获取数组以形成 2D numpy.ndarray

 [[1, 2, 1],
 [5, 4, 6],
 [7, 20, 9]]
Run Code Online (Sandbox Code Playgroud)

形状:(3,3)

我试试

print(df['Value'].values)
Run Code Online (Sandbox Code Playgroud)

但它给了我

[list([1, 2, 1]) list([5, 4, 6]) list([7, 20, 9])]
Run Code Online (Sandbox Code Playgroud)

这不是我想要的

cs9*_*s95 7

您可以提取列列表,然后使用以下几种方法进行数组化。

np.array(df['Value'].tolist())

array([[ 1,  2,  1],
       [ 5,  4,  6],
       [ 7, 20,  9]])
Run Code Online (Sandbox Code Playgroud)
# np.vstack(df['Value'])
np.stack(df['Value'])

array([[ 1,  2,  1],
       [ 5,  4,  6],
       [ 7, 20,  9]])
Run Code Online (Sandbox Code Playgroud)

如果列表大小不均匀,这将返回一个常规的二维数组,其中 nans 位于缺失位置。

df['Value'] = [[1, 2], [3], [4, 5, 6]]
df

   ID      Value
0   0     [1, 2]
1   1        [3]
2   2  [4, 5, 6]
Run Code Online (Sandbox Code Playgroud)

# pd.DataFrame(df['Value'].tolist()).values   #  < v0.24
pd.DataFrame(df['Value'].tolist()).to_numpy() #  v0.24+

array([[ 1.,  2., nan],
       [ 3., nan, nan],
       [ 4.,  5.,  6.]])
Run Code Online (Sandbox Code Playgroud)