在重塑时使用python ravel与transpose

Question

在重塑时使用python ravel与transpose

我有一个二维数组v,v.shape=(M_1,M_2),我要重塑成一个三维阵列v.shape=(M_2,N_1,N_2),和M_1=N_1*N_2.

我想出了以下几行产生相同的结果:

np.reshape(v.T, reshape_tuple)

Run Code Online (Sandbox Code Playgroud)

和

np.reshape(v.ravel(order='F'), reshape_tuple)

Run Code Online (Sandbox Code Playgroud)

对 reshape_tuple=(M_2,N_1,N_2).

如果原始v是一个巨大的(可能是复数值的)矩阵,哪一个在计算上更好,在什么意义上(comp时间,内存等)？

我的猜测是使用转置更好,但如果reshape是自动ravel然后ravel-option reshape可能更快(虽然可能ravel在C或Fortran中做,然后它不清楚)？

Answer 1

hpa*_*ulj 4

他们做事的顺序——重塑、改变步幅和复制——不同，但他们最终做的是同样的事情。

我喜欢用它__array_interface__来查看数据缓冲区所在的位置以及其他变化。我想我应该添加来flags查看order. 但我们/你知道transpose顺序F已更改为，对吗？

In [549]: x=np.arange(6).reshape(2,3)
In [550]: x.__array_interface__
Out[550]: 
{'data': (187732024, False),
 'descr': [('', '<i4')],
 'shape': (2, 3),
 'strides': None,
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

transpose 是一个视图，具有不同的形状、步长和顺序：

In [551]: x.T.__array_interface__
Out[551]: 
{'data': (187732024, False),
 'descr': [('', '<i4')],
 'shape': (3, 2),
 'strides': (4, 12),
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

不同顺序的ravel是一个副本（不同的数据缓冲区指针）

In [552]: x.ravel(order='F').__array_interface__
Out[552]: 
{'data': (182286992, False),
 'descr': [('', '<i4')],
 'shape': (6,),
 'strides': None,
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

transpose ravel 也是一个副本。我认为相同的数据指针只是内存重用的一种情况（因为我没有分配给变量） - 但这是可以检查的。

In [553]: x.T.ravel().__array_interface__
Out[553]: 
{'data': (182286992, False),
 'descr': [('', '<i4')],
 'shape': (6,),
 'strides': None,
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

添加重塑：

In [554]: x.T.ravel().reshape(2,3).__array_interface__
Out[554]: 
{'data': (182286992, False),
 'descr': [('', '<i4')],
 'shape': (2, 3),
 'strides': None,
 'typestr': '<i4',
 'version': 3}
In [555]: x.ravel(order='F').reshape(2,3).__array_interface__
Out[555]: 
{'data': (182286992, False),
 'descr': [('', '<i4')],
 'shape': (2, 3),
 'strides': None,
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

我认为重塑中有一个隐含的“混乱”：

In [558]: x.T.reshape(2,3).__array_interface__
Out[558]: 
{'data': (182286992, False),
 'descr': [('', '<i4')],
 'shape': (2, 3),
 'strides': None,
 'typestr': '<i4',
 'version': 3}

Run Code Online (Sandbox Code Playgroud)

（我应该重新编写这些示例，以消除内存重用的歧义。）无论如何，转置后的重塑需要与顺序更改的 ravel 相同的内存副本。据我所知，这两种情况都只需要一份副本。其他操作仅涉及形状等属性的更改。

如果我们只看数组可能会更清楚

In [565]: x.T
Out[565]: 
array([[0, 3],
       [1, 4],
       [2, 5]])

Run Code Online (Sandbox Code Playgroud)

在中，T我们仍然可以按数字顺序逐步遍历数组。但在重塑之后，与 .1相差甚远0。显然有一个副本。

In [566]: x.T.reshape(2,3)
Out[566]: 
array([[0, 3, 1],
       [4, 2, 5]])

Run Code Online (Sandbox Code Playgroud)

ravel 后的值顺序看起来很相似，在 reshape 后更明显。

In [567]: x.ravel(order='F')
Out[567]: array([0, 3, 1, 4, 2, 5])
In [568]: x.ravel(order='F').reshape(2,3)
Out[568]: 
array([[0, 3, 1],
       [4, 2, 5]])

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，7 月前
查看次数：	867 次
最近记录：	9 年，3 月前