在本教程中关于对象检测,提到了快速R-CNN.还提到了ROI(感兴趣区域)层.
在数学上,当根据最终卷积层激活函数(在每个单元格中)调整区域提议的大小时,会发生什么?
object-detection computer-vision deep-learning conv-neural-network
这两个注意事项用于seq2seq模块.这个张量流文档中引入了两个不同的注意事项作为乘法和附加注意事项.有什么不同?
流行的 NLP 模型BERT中使用了激活函数高斯误差线性单元(GELUs)。有什么实在的理由吗?
我在 pytorch 中编写了一个自定义数据加载器类。但是在迭代一个纪元内的所有批次时,它失败了。例如,假设我有 100 个数据示例,我的批处理大小为 9。它会在第 10 次迭代中失败,说批处理大小不同,这将使批处理大小为 1 而不是 10。我已将自定义数据加载器放在下面。此外,我已将如何从 for 循环内的加载程序中提取数据。
class FlatDirectoryAudioDataset(tdata.Dataset): #customized dataloader
def __init__(self, data_dir, transform=None):
self.data_dir = data_dir
self.transform = transform
self.files = self.__setup_files()
def __len__(self):
"""
compute the length of the dataset
:return: len => length of dataset
"""
return len(self.files)
def __setup_files(self):
file_names = os.listdir(self.data_dir)
files = [] # initialize to empty list
for file_name in file_names:
possible_file = os.path.join(self.data_dir, file_name)
if os.path.isfile(possible_file) and (file_name.lower().endswith('.wav') or file_name.lower().endswith('.mp3')): #&& (possible_file.lower().endswith('.wav') or possible_file.lower().endswith('.mp3')):
files.append(possible_file) …
Run Code Online (Sandbox Code Playgroud) self.center_words = tf.placeholder(tf.int32, shape=[self.batch_size], name='op testing')
print("Extracting the op",self.center_words.op)
Run Code Online (Sandbox Code Playgroud)
在上面我创建了一个名为"op testing"的tf占位符.当我打印self.center_words.op时,它打印出这样的结构
op: "Placeholder"
attr {
key: "dtype"
value {
type: DT_INT32
}
}
attr {
key: "shape"
value {
shape {
dim {
size: 128
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
这适用于任何张量流变量,函数输出等.这是什么.op?
在这个Tensorflow检测模型动物园中,他们提到了不同检测体系结构的COCO mAp评分.他们还表示,mAp得分越高,准确度越高.什么是不明白的是如何计算?它可以获得的最高分是多少?为什么这个mAp评分与数据集的数据不同?
我正在尝试在句子分类任务中使用变压器嵌入,而不对其进行微调。我使用过 BERT 嵌入,这些实验给了我非常好的结果。现在我想使用 GPT-2 嵌入(无需微调)。所以我有两个问题,
R-CNN究竟做了什么?是否就像使用CNN提取的功能来检测指定窗口区域中的类一样?这是否有任何tensorflow实现?
如果我们在seq2seq模型中使用波束搜索,它将提供更合适的结果.有几个tensorflow实现.但是,通过每个单元格中的softmax功能,您无法在训练过程中使用波束搜索.那么在使用光束搜索时还有其他任何修改过的优化函数吗?