您知道如何将DataFrame的索引或列作为NumPy数组或python列表获取吗?
我有一个excel文档,看起来像这样..
cluster load_date budget actual fixed_price
A 1/1/2014 1000 4000 Y
A 2/1/2014 12000 10000 Y
A 3/1/2014 36000 2000 Y
B 4/1/2014 15000 10000 N
B 4/1/2014 12000 11500 N
B 4/1/2014 90000 11000 N
C 7/1/2014 22000 18000 N
C 8/1/2014 30000 28960 N
C 9/1/2014 53000 51200 N
Run Code Online (Sandbox Code Playgroud)
我希望能够返回第1列的内容 - 群集作为列表,因此我可以在其上运行for循环,并为每个群集创建一个excel工作表.
是否也可以将整行的内容返回到列表中?例如
list = [], list[column1] or list[df.ix(row1)]
Run Code Online (Sandbox Code Playgroud) 将列表列表转换为pandas数据帧很容易:
import pandas as pd
df = pd.DataFrame([[1,2,3],[3,4,5]])
Run Code Online (Sandbox Code Playgroud)
但是如何将df变回列表列表呢?
lol = df.what_to_do_now?
print lol
# [[1,2,3],[3,4,5]]
Run Code Online (Sandbox Code Playgroud) 我有一个包含多列的Python dataFrame.
LogBlk Page BayFail
0 0 [0, 1, 8, 9]
1 16 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14]
2 32 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14]
3 48 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14]
Run Code Online (Sandbox Code Playgroud)
我想找到与LogBlk = 0和Page = 0相关联的BayFails.
df2 = df[ (df['Page'] == 16) & (df['LogBlk'] == 0) ]['BayFail']
Run Code Online (Sandbox Code Playgroud)
这将返回[0,1,8,9]
我想要做的是将此pandas.series转换为列表.有谁知道这是怎么做到的吗?
我有一个pandas数据帧,我转换为numpy数组,如下所示:
df.values
Run Code Online (Sandbox Code Playgroud)
它给出了以下输出:
array([[2],
[0],
[1],
...,
[0],
[1],
[0]], dtype=int64)
Run Code Online (Sandbox Code Playgroud)
但是我想获得如下列表:
[0, 2, 3]
Run Code Online (Sandbox Code Playgroud)
知道怎么做吗?