小编Kau*_*kar的帖子

在OpenCV中使用H.264压缩编写视频文件

如何使用OpenCV中的VideoWriter类使用H.264压缩编写视频?我基本上想从网络摄像头获取视频并在按下一个角色后保存.使用MPEG4 Part 2压缩时,输出视频文件非常庞大.

c++ opencv image-processing video-processing computer-vision

14
推荐指数
1
解决办法
3万
查看次数

如何在Keras Lambda Layer中使用OpenCV函数?

我试图使用一个在图像上使用一些OpenCV函数的函数.但我得到的数据是张量,我无法将其转换为图像.

def image_func(img):
     img=cv2.cvtColor(img,cv2.COLOR_BGR2YUV) 
     img=cv2.resize(img,(200,66))
     return img

model=Sequential()
model.add(Lambda(get_ideal_img,input_shape=(r,c,ch),output_shape=(r,c,ch)))
Run Code Online (Sandbox Code Playgroud)

当我运行这个片段时,它会在cvtColor函数中抛出一个错误,说这img不是一个numpy数组.我打印出来img,似乎是张量.

我不知道如何将张量更改为图像然后返回张量.我希望模型有这个层.

如果我无法通过lambda图层实现这一目标,我还能做些什么?

python opencv keras keras-layer

5
推荐指数
2
解决办法
1529
查看次数

张量流中的可微直方图

如何在张量流中获得可微分的直方图函数。我想使用图像的直方图来计算特定的损失函数。但是tensorflow提供的直方图函数,tf.histogram_fixed_width()是不可微的。我该怎么办?

python tensorflow

5
推荐指数
0
解决办法
505
查看次数

在张量流中实现两幅图像之间的交叉熵损失

我正在尝试为完全转换网络实现两个图像之间的交叉熵损失。我的训练图像和输入图像都在 0-1 范围内。现在,我尝试仅针对一类图像实现此功能。为了说明这一点,我有不同的橙色图片,但只有橙色图片。我已经构建了模型并实现了交叉熵损失函数。

def loss_func_entropy(logits,y):
    logits=tf.reshape(logits,[BATCH_SIZE*480*640,1])
    y=tf.reshape(y,[BATCH_SIZE*480*640,1])
    print (logits.get_shape(),y.get_shape())
    return tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits,labels=y,dim=0) )
Run Code Online (Sandbox Code Playgroud)

显然我做得不对,因为我的损失函数不断增加。需要注意的是 logits 和 y 都是二维的。我将它们重塑为单个向量并尝试进行交叉熵。

deep-learning tensorflow

2
推荐指数
1
解决办法
4727
查看次数