Tensorflow 膨胀的行为与形态膨胀不同

Question

Tensorflow 膨胀的行为与形态膨胀不同

Jav*_*Jav 7 python image-processing mathematical-morphology image-morphology tensorflow

如以下代码所示，tensorflowtf.nn.dilation2D函数的行为不像传统的扩张运算符。

import tensorflow as tf
tf.InteractiveSession()
A = [[0, 0, 0, 0, 0, 0, 0],
     [0, 0, 0, 0, 1, 0, 0],
     [0, 0, 0, 1, 1, 1, 0],
     [0, 0, 0, 0, 1, 0, 0],
     [0, 0, 0, 0, 0, 0, 0],
     [0, 0, 0, 0, 0, 0, 0]]
kernel = tf.ones((3,3,1))
input4D = tf.cast(tf.expand_dims(tf.expand_dims(A, -1), 0), tf.float32)
output4D = tf.nn.dilation2d(input4D, filter=kernel, strides=(1,1,1,1), rates=(1,1,1,1), padding="SAME")
print(tf.cast(output4D[0,:,:,0], tf.int32).eval())

Run Code Online (Sandbox Code Playgroud)

返回以下张量：

array([[1, 1, 1, 2, 2, 2, 1],
       [1, 1, 2, 2, 2, 2, 2],
       [1, 1, 2, 2, 2, 2, 2],
       [1, 1, 2, 2, 2, 2, 2],
       [1, 1, 1, 2, 2, 2, 1],
       [1, 1, 1, 1, 1, 1, 1]], dtype=int32)

Run Code Online (Sandbox Code Playgroud)

我不明白为什么它会这样，也不明白我应该如何使用tf.nn.dilation2d来检索预期的输出：

array([[0, 0, 0, 1, 1, 1, 0],
       [0, 0, 1, 1, 1, 1, 1],
       [0, 0, 1, 1, 1, 1, 1],
       [0, 0, 1, 1, 1, 1, 1],
       [0, 0, 0, 1, 1, 1, 0],
       [0, 0, 0, 0, 0, 0, 0]], dtype=int32)

Run Code Online (Sandbox Code Playgroud)

有人可以启发 tensorflow 的简洁文档并解释该tf.nn.dilation2D函数的作用吗？

Answer 1

Cri*_*ngo 7

正如链接的文档页面中所述，

计算 4-D 输入和 3-D 滤波器张量的灰度膨胀。

和

详细地说，灰度形态二维膨胀是最大和相关 [...]

这意味着内核的值与图像在每个位置的值相加，然后取最大值作为输出值。

将此与相关性进行比较，将乘法替换为加法，并将积分（或和）替换为最大值：

卷积：g ( t ) = ? f () h (- t ) d

膨胀：g ( t ) = max_{{ f () + h (- t ) }}

或者在离散世界中：

卷积：g [ n ] = ? _k f [ k ] h [ k - n ]

膨胀：g [ n ] = max _k { f [ k ] + h [ k - n ] }

具有二元结构元素（内核，问题称为“常规扩张”）的扩张使用仅包含 1 和 0 的结构元素（内核）。这些表示“包括”和“排除”。也就是说，1 确定结构元素的域。

要使用灰度值膨胀重新创建相同的行为，请将“包含”像素设置为 0，将“排除”像素设置为负无穷大。

例如，问题中使用的 3x3 正方形结构元素应该是 3x3 零矩阵。

归档时间：	6 年，9 月前
查看次数：	2154 次
最近记录：	6 年，6 月前