Kei*_*thx 10 python arrays numpy pandas
我有一个看起来像这样的numpy数组:
a = np.array([35,2,160,56,120,80,1,1,0,0,1])
Run Code Online (Sandbox Code Playgroud)
然后我试图将该数组转换为具有逻辑"一列一值"的pandas数据帧,如下所示:
columns=['age','gender','height',
'weight','ap_hi','ap_lo',
'cholesterol','gluc','smoke',
'alco','active']
values = a
df = pd.DataFrame(a,columns=columns)
Run Code Online (Sandbox Code Playgroud)
这种方法引发了ValueError:传递值的形状是(1,11),索引暗示(11,11).我做错了什么以及如何以正确的方式执行它?
谢谢!
jez*_*ael 14
你需要numpy.reshape:
columns=['age','gender','height',
'weight','ap_hi','ap_lo',
'cholesterol','gluc','smoke',
'alco','active']
a = np.array([35,2,160,56,120,80,1,1,0,0,1])
df = pd.DataFrame(a.reshape(-1, len(a)),columns=columns)
print (df)
age gender height weight ap_hi ap_lo cholesterol gluc smoke alco \
0 35 2 160 56 120 80 1 1 0 0
active
0 1
Run Code Online (Sandbox Code Playgroud)
如果不能清楚地重新读取整形操作,则可以使用更明确的方法向1d数组添加维度 numpy.atleast_2d
pd.DataFrame(np.atleast_2d(a), columns=columns)
Run Code Online (Sandbox Code Playgroud)
或者更简单的添加[](但如果真的很多列则更慢):
df = pd.DataFrame([a],columns=columns)
print (df)
age gender height weight ap_hi ap_lo cholesterol gluc smoke alco \
0 35 2 160 56 120 80 1 1 0 0
active
0 1
Run Code Online (Sandbox Code Playgroud)
感谢Divakar的建议:
df = pd.DataFrame(a[None],columns=columns)
print (df)
age gender height weight ap_hi ap_lo cholesterol gluc smoke alco \
0 35 2 160 56 120 80 1 1 0 0
active
0 1
Run Code Online (Sandbox Code Playgroud)
另一个解决方案,谢谢piRSquared:
pd.DataFrame([a], [0], columns)
Run Code Online (Sandbox Code Playgroud)