nut*_*014 5 python arrays numpy python-3.x pandas
我有一个 DataFrame,其中包含不同学生上学的数据。它有不同的列,如rank、major_code、major等unemployed。
我使用df.values(在本例中recent_grads.values)返回 DataFrame 的 numpy 表示。
recent_grads_np = recent_grads.values
print(recent_grads_np)
Run Code Online (Sandbox Code Playgroud)
这相当于d.values将整个 DataFrame 更改为 Numpy 数组。结果是这样的:
[[1 2419 'PETROLEUM ENGINEERING' ... 1534 364 193]
[2 2416 'MINING AND MINERAL ENGINEERING' ... 350 257 50]
[3 2415 'METALLURGICAL ENGINEERING' ... 456 176 0]
...
[172 5203 'COUNSELING PSYCHOLOGY' ... 2403 1245 308]
[173 3501 'LIBRARY SCIENCE' ... 288 338 192]]
Run Code Online (Sandbox Code Playgroud)
如何从整个 Dataframe 中仅选择几列,然后转换为 numpy 数组?
小智 4
您应该轻松地在 Dataframe 末尾使用“.values”,它会给您 numpy 数组。
要选择特定的数据框列,您可以说 df[["A","B","C"]] ,其中“A”、“B”和“C”是您的列名称。
所以: df[["A","B","C"]].values
会给你你所要求的。