作为背景,我对机器学习的世界相对较新,我正在尝试一个目标是在NBA游戏中对游戏进行分类的项目.我输入的是NBA比赛中每场比赛的40帧序列,我的标签是给定比赛的11个无所不包的分类.
计划是采用每个帧序列并将每个帧传递到CNN以提取一组特征.然后,来自给定视频的每个特征序列将被传递到RNN.
我目前正在使用Keras进行大部分实施,我选择在我的CNN上使用VGG16模型.以下是一些相关代码:
video = keras.Input(shape = (None, 255, 255, 3), name = 'video')
cnn = keras.applications.VGG16(include_top=False, weights = None, input_shape=
(255,255,3), pooling = 'avg', classes=11)
cnn.trainable = True
Run Code Online (Sandbox Code Playgroud)
我的问题是 - 如果我的目标是对NBA比赛的视频片段进行分类,那么将VGG16 ConvNet的权重初始化为'imagenet'对我来说仍然有益吗?如果是这样,为什么?如果没有,我如何训练VGG16 ConvNet获取我自己的权重集,然后如何将它们插入到此函数中?在使用VGG16模型时,我没有找到任何有人使用自己的权重集的教程.
如果我的问题看起来很幼稚,我会道歉但我真的很感激任何有助于清理它的人.