cs9*_*s95 6 python arrays numpy
我正在尝试使用 重塑 numpy 数组numpy.strided_tricks。这是我正在遵循的指南:https ://stackoverflow.com/a/2487551/4909087
我的用例非常相似,不同之处在于我需要 3 的步幅。
给定这个数组:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
Run Code Online (Sandbox Code Playgroud)
我想得到:
array([[1, 2, 3],
[2, 3, 4],
[3, 4, 5],
[4, 5, 6],
[5, 6, 7],
[6, 7, 8],
[7, 8, 9]])
Run Code Online (Sandbox Code Playgroud)
这是我尝试过的:
import numpy as np
as_strided = np.lib.stride_tricks.as_strided
a = np.arange(1, 10)
as_strided(a, (len(a) - 2, 3), (3, 3))
array([[ 1, 2199023255552, 131072],
[ 2199023255552, 131072, 216172782113783808],
[ 131072, 216172782113783808, 12884901888],
[216172782113783808, 12884901888, 768],
[ 12884901888, 768, 1125899906842624],
[ 768, 1125899906842624, 67108864],
[ 1125899906842624, 67108864, 4]])
Run Code Online (Sandbox Code Playgroud)
我很确定我已经按照这个例子做到了,但显然没有。我哪里错了?
接受的答案(和讨论)很好,但为了不想运行自己的测试用例的读者的利益,我将尝试说明正在发生的事情:
In [374]: a = np.arange(1,10)
In [375]: as_strided = np.lib.stride_tricks.as_strided
In [376]: a.shape
Out[376]: (9,)
In [377]: a.strides
Out[377]: (4,)
Run Code Online (Sandbox Code Playgroud)
对于连续的一维数组,strides是元素的大小,这里是 4 个字节,一个 int32。要从一个元素移动到下一个元素,它会前进 4 个字节。
OP尝试了什么:
In [380]: as_strided(a, shape=(7,3), strides=(3,3))
Out[380]:
array([[ 1, 512, 196608],
[ 512, 196608, 67108864],
[ 196608, 67108864, 4],
[ 67108864, 4, 1280],
[ 4, 1280, 393216],
[ 1280, 393216, 117440512],
[ 393216, 117440512, 7]])
Run Code Online (Sandbox Code Playgroud)
这是步进了 3 个字节,跨越了 int32 边界,并且给出了大部分难以理解的数字。如果 dtype 是 bytes 或 uint8,则可能更有意义。
相反,使用a.strides*2(元组复制),或者(4,4)我们得到所需的数组:
In [381]: as_strided(a, shape=(7,3), strides=(4,4))
Out[381]:
array([[1, 2, 3],
[2, 3, 4],
[3, 4, 5],
[4, 5, 6],
[5, 6, 7],
[6, 7, 8],
[7, 8, 9]])
Run Code Online (Sandbox Code Playgroud)
列和行都步进一个元素,从而产生 1 步移动窗口。我们还可以设置shape=(3,7)3 个窗口 7 个元素长。
In [382]: _.strides
Out[382]: (4, 4)
Run Code Online (Sandbox Code Playgroud)
将每个窗口的步幅更改为 (8,4) 步骤 2 个元素。
In [383]: as_strided(a, shape=(7,3), strides=(8,4))
Out[383]:
array([[ 1, 2, 3],
[ 3, 4, 5],
[ 5, 6, 7],
[ 7, 8, 9],
[ 9, 25, -1316948568],
[-1316948568, 184787224, -1420192452],
[-1420192452, 0, 0]])
Run Code Online (Sandbox Code Playgroud)
但形状已关闭,向我们显示原始数据缓冲区末尾的字节。这可能很危险(我们不知道这些字节是否属于其他对象或数组)。对于这个大小的数组,我们无法获得完整的 2 步窗口集。
现在为每行添加 3 个元素 (3*4, 4):
In [384]: as_strided(a, shape=(3,3), strides=(12,4))
Out[384]:
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
In [385]: a.reshape(3,3).strides
Out[385]: (12, 4)
Run Code Online (Sandbox Code Playgroud)
这与 3x3 重塑具有相同的形状和步幅。
我们可以设置负步幅值和 0 值。事实上,沿着具有正步幅的维度进行负步切片将给出负步幅,并且通过设置 0 步幅来进行广播:
In [399]: np.broadcast_to(a, (2,9))
Out[399]:
array([[1, 2, 3, 4, 5, 6, 7, 8, 9],
[1, 2, 3, 4, 5, 6, 7, 8, 9]])
In [400]: _.strides
Out[400]: (0, 4)
In [401]: a.reshape(3,3)[::-1,:]
Out[401]:
array([[7, 8, 9],
[4, 5, 6],
[1, 2, 3]])
In [402]: _.strides
Out[402]: (-12, 4)
Run Code Online (Sandbox Code Playgroud)
但是,负步幅需要调整原始数组中的哪个元素是视图的第一个元素,并且as_strided没有相应的参数。
a我不知道为什么你认为你需要 3 的步幅。你需要步幅一个元素和下一个元素之间的字节距离,你可以使用a.strides:
as_strided(a, (len(a) - 2, 3), a.strides*2)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4069 次 |
| 最近记录: |