我有一个numpy形状(6,2)
[[00,01],
[10,11],
[20,21],
[30,31],
[40,41],
[50,51]]
Run Code Online (Sandbox Code Playgroud)
我需要一个步长为1的滑动窗口,窗口大小为3喜欢这个:
[[00,01,10,11,20,21],
[10,11,20,21,30,31],
[20,21,30,31,40,41],
[30,31,40,41,50,51]]
Run Code Online (Sandbox Code Playgroud)
我正在寻找一个numpy解决方案.如果您的解决方案可以参数化原始数组的形状以及窗口大小和步长,那就太好了.
我发现这个相关的答案使用步幅有效的移动平均滤波器,但我没有看到如何指定那里的步长以及如何将窗口从3d折叠到连续的2d数组.这个滚动或滑动窗口迭代器在Python中,但是在Python中,我不确定它的效率如何.此外,它支持元素,但如果每个元素具有多个特征,则最终不会将它们连接在一起.
我在tensorflow API中找到了以下方法tf.extract_image_patches,但我不清楚它的功能.
说batch_size = 1,和图像大小225x225x3,我们想要提取大小的补丁32x32.
这个功能到底是怎么表现的?具体来说,文档提到了输出张量的维度[batch, out_rows, out_cols, ksize_rows * ksize_cols * depth],但未提及的是什么out_rows和out_cols未提及.
理想情况下,给定一个大小的输入图像张量1x225x225x3(其中1是批量大小),我希望能够获得Kx32x32x3输出,其中K是补丁的总数,并且32x32x3是每个补丁的维度.张量流中有什么东西已经实现了吗?