在numpy histogram2d中"解压缩的值太多"

mar*_*ian 7 python numpy histogram histogram2d

我正在使用numpy histogram2d来计算两个变量的二维直方图的可视化表示的值:

H, xedges, yedges = np.histogram2d(Z[:,0], Z[:,1], bins=100)
Run Code Online (Sandbox Code Playgroud)

其中Z是一个numpy矩阵

我得到的错误是:

Traceback (most recent call last):
File "/home/.../pca_analysis.py", line 141, in <module>
   H, xedges, yedges = np.histogram2d(Z[:,0], Z[:,1], bins=100)
File "/usr/lib/python2.7/dist-packages/numpy/lib/twodim_base.py", line 615, in histogram2d
   hist, edges = histogramdd([x,y], bins, range, normed, weights)
File "/usr/lib/python2.7/dist-packages/numpy/lib/function_base.py", line 281, in histogramdd
   N, D = sample.shape
ValueError: too many values to unpack
Run Code Online (Sandbox Code Playgroud)

我真的不明白为什么我会收到这个错误.我尝试使用随机值的histogram2d函数,它正常工作.我也尝试在numpy数组和简单列表中转换Z [:,0]和Z [:,1],但我遇到了同样的问题.

ask*_*han 6

正如@seberg在评论中指出的那样,它Z是一个矩阵,因此必须在切片之前将其转换为数组.

np.asarray(Z)[:,0]
Run Code Online (Sandbox Code Playgroud)

这是必要的原因是因为np.matrix即使在切片之后仍保持其二维性,因此矩阵列具有形状(N,1),而不是(N,)直方图函数所期望的.

切片无法转换为数组的原因是通过转换不改变形状; 切片的行为是不同的.

如果没有意义,这里是一个例子:

In [4]: a = np.arange(9).reshape(3,3)

In [5]: a
Out[5]: 
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [6]: m = np.matrix(a)

In [7]: m
Out[7]: 
matrix([[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]])

In [8]: m[:,0]
Out[8]: 
matrix([[0],
        [3],
        [6]])

In [9]: a[:,0]
Out[9]: array([0, 3, 6])

In [10]: m[:,0].shape
Out[10]: (3, 1)

In [11]: a[:,0].shape
Out[11]: (3,)
Run Code Online (Sandbox Code Playgroud)

如果你在切片后施放,形状仍然是2d:

In [12]: np.array(m[:,0])
Out[12]: 
array([[0],
       [3],
       [6]])

In [13]: np.array(m[:,0]).shape
Out[13]: (3, 1)
Run Code Online (Sandbox Code Playgroud)