小编cha*_*lfa的帖子

Keras/TF:用于视觉识别的时间分布式 CNN+LSTM

在此处输入图片说明

我正在尝试实现文章 ( https://arxiv.org/abs/1411.4389 ) 中的模型,该模型基本上由时间分布的 CNN 和一系列使用 Keras 和 TF 的 LSTM 组成。

但是,我在尝试确定是否应该TimeDirstibuted仅针对卷积和池化层或 LSTM包含该函数时遇到问题?

有没有办法并行运行 CNN 层(基于我要处理的序列中的帧数和我拥有的内核数)?

最后,假设每个条目由“n”帧(按顺序)组成,其中 n 根据当前数据条目而变化,最合适的输入维度是什么?“n”是批量大小吗?有没有办法将 // 中的 CNN 数量限制为例如 4(以便在处理 4 帧后获得输出 Y)?

PS:输入是小视频(即帧序列)

PS:输出维度与我的问题无关,所以这里不讨论

谢谢

python neural-network deep-learning keras tensorflow

8
推荐指数
1
解决办法
1万
查看次数