``我正在尝试使用TensorFlow中的图像数据增强方法,例如旋转,随机亮度,随机饱和度等各种方法。我观察到的是tf.image.random_brightness的输出不一致-有时会产生负值。我了解随机性,但是产生负值是否正确?当我尝试使用matplotlib.pyplot绘制图像时,它无法显示ValueError:浮点图像RGB值必须在0..1范围内。下面是一些代码示例:'
# Function which reads file and converts to image array
def read_images_from_file (input_queue):
label = input_queue[1]
file_content = tf.read_file(input_queue[0])
image = tf.image.decode_jpeg(file_content, channels=NUM_CHANNELS)
image = tf.image.convert_image_dtype(image, dtype=tf.float32, saturate=True)
image = tf.image.resize_images(image, [IMAGE_HEIGHT, IMAGE_WIDTH])
.....
#inside a function which applies various augmentations - code shown only for brightness
X_init = tf.placeholder(tf.float32, shape=images.shape)
X = tf.Variable(X_init)
sess.run(tf.variables_initializer([X]), feed_dict={X_init: images})
aug_images, aug_labels = (sess.run(tf.map_fn(lambda params: (tf.image.random_brightness(params[0], 0.8, 1), params[1]), (X, labels))))
#inside a loop after calling above function - output of function is returned to aug_train_images
print (aug_train_images[i])
'Some sample output:'
[[[-0.18852733 -0.27872342 -0.31009597]
[-0.18059228 -0.2786315 -0.3060825 ]
[-0.1765788 -0.27461803 -0.302069 ]
...
[-0.20366213 -0.19974056 -0.18405429]
[-0.22792684 -0.22437292 -0.20458125]
[-0.24324547 -0.23166458 -0.21205674]]
Run Code Online (Sandbox Code Playgroud)
``我在Ubuntu 16.10上使用具有Python 3.5.3和TensorFlow CPU版本1.5.0-rc0的Jupyter笔记本。''
您允许强度(delta)在-0.8到0.8之间随机变化:
tf.image.random_brightness(params[0], 0.8, 1)
Run Code Online (Sandbox Code Playgroud)
请注意,图像强度在[0-1]范围内,因为您这样做:
image = tf.image.convert_image_dtype(image, dtype=tf.float32, saturate=True)
Run Code Online (Sandbox Code Playgroud)
这意味着图像中的每个强度值i都会在以下之间变化:
[i-0.8, i+0.8]
Run Code Online (Sandbox Code Playgroud)
超出图像的[0-1]范围。换句话说,您将拥有负值和大于1的值。
第一条评论是0.8的增量似乎太大(当然,这取决于问题)。我建议在0.1左右(即允许10%的变化)。
第二件事是,您必须确保更改亮度后,图像仍然是图像,即将强度限制在[0-1]范围内。您可以通过以下方式做到这一点:
image = tf.clip_by_value(image, 0.0, 1.0)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1812 次 |
| 最近记录: |