如何将数据框中的多列转换为 numpy 数组?

nut*_*014 5 python arrays numpy python-3.x pandas

我有一个 DataFrame,其中包含不同学生上学的数据。它有不同的列,如rankmajor_codemajorunemployed

我使用df.values(在本例中recent_grads.values)返回 DataFrame 的 numpy 表示。

recent_grads_np = recent_grads.values
print(recent_grads_np)
Run Code Online (Sandbox Code Playgroud)

这相当于d.values将整个 DataFrame 更改为 Numpy 数组。结果是这样的:

[[1 2419 'PETROLEUM ENGINEERING' ... 1534 364 193]
 [2 2416 'MINING AND MINERAL ENGINEERING' ... 350 257 50]
 [3 2415 'METALLURGICAL ENGINEERING' ... 456 176 0]
 ...
 [172 5203 'COUNSELING PSYCHOLOGY' ... 2403 1245 308]
 [173 3501 'LIBRARY SCIENCE' ... 288 338 192]]
Run Code Online (Sandbox Code Playgroud)

如何从整个 Dataframe 中仅选择几列,然后转换为 numpy 数组?

小智 4

您应该轻松地在 Dataframe 末尾使用“.values”,它会给您 numpy 数组。

要选择特定的数据框列,您可以说 df[["A","B","C"]] ,其中“A”、“B”和“C”是您的列名称。

所以: df[["A","B","C"]].values

会给你你所要求的。