我正在尝试在我的笔记本电脑上安装 docker,我发现repo 中有三个包:
谁能用简单的语言向我解释这些包之间的区别,每个包的作用,以及每个包对应的 docker 架构的哪一部分?另外,它们可以相互独立工作吗?
我最近一直在学习RetinaNet。我阅读了原始论文和一些相关文章,并写了一篇帖子分享我的经验教训:http : //blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/。但是,我仍然有一些困惑,我也在帖子中指出。谁能启发我?
困惑1
如论文所示,如果锚框的IoU与任何地面真相均低于0.4,则将其分配给背景。在这种情况下,对应的分类目标标签应该是什么(假设有K个类别)?
我知道SSD具有背景类别(总共使K + 1个类别),而YOLO预测置信度得分,该置信度得分指示除K类概率之外,盒子中是否存在物体(不是背景)(不是背景) 。虽然我在论文中未找到任何表明RetinaNet包含背景类的陈述,但我确实看到了以下陈述:“ ...,我们仅将检测器的置信度阈值设为0.05后,才从...解码盒预测。”表明存在对置信度得分的预测。但是,此分数从何而来(由于分类子网仅输出表示K个类别的概率的K个数字)?
如果RetinaNet与SSD或YOLO定义目标标签的方式不同,我将假定目标是长度为K的矢量,所有条目均为0,没有1。但是,在这种情况下,如果它是假阴性,那么焦点损失(请参阅下面的定义)将如何惩罚锚点?
哪里
困惑2
与许多其他检测器不同,RetinaNet使用与类无关的包围盒回归器,而分类子网的最后一层的激活是S形激活。这是否意味着一个锚框可以同时预测不同类别的多个对象?
困惑#3
让我们用$ {(A ^ i,G ^ i)} _ {i = 1,... N} $来表示这些匹配的锚点框和地面真相框对,其中$ A $代表锚点,$ G $代表基本事实,$ N $是匹配数。
对于每个匹配的锚点,回归子网会预测四个数字,我们将其表示为$ P ^ i =(P ^ i_x,P ^ i_y,P ^ i_w,P ^ i_h)$。前两个数字指定锚点$ A ^ i $和地面真值$ G ^ i $的中心之间的偏移,而后两个数字指定锚点的宽度/高度与地面真点之间的偏移。相应地,对于这些预测中的每一个,都有一个回归目标$ T ^ i $计算为锚点与地面真相之间的偏移量:
以上方程式正确吗?
在此先感谢您,并随时在帖子中指出其他误解!
更新:
供将来参考,这是我在学习RetinaNet时遇到的另一种困惑(我发现此对话很轻松):
我所在的机构有一台带有 2 个 GPU 的共享服务器。假设有两个团队成员都想同时训练一个模型,那么他们如何让 Keras 在特定的 GPU 上训练他们的模型以避免资源冲突?
理想情况下,Keras 应该找出当前哪个 GPU 正在忙于训练模型,然后使用另一个 GPU 来训练另一个模型。然而,情况似乎并非如此。似乎默认情况下,Keras 只使用第一个 GPU(因为Volatile GPU-Util第二个 GPU 的 总是 0%)。
字符串值按R中的字母顺序排序,因此默认情况下,字符串small似乎"大于"字符串,moderate并且huge:
a <- c("small", "moderate", "huge")
sort(a, decreasing = F)
#> [1] "huge" "moderate" "small"
a > "small"
#> [1] FALSE FALSE FALSE
Run Code Online (Sandbox Code Playgroud)
更改R中字符串顺序的最合理方法是将它们存储为因子并指定级别:
b <- factor(c("small", "moderate", "huge"), levels = c("small", "moderate", "huge"))
sort(b, decreasing = F)
#> [1] small moderate huge
#> Levels: small moderate huge
Run Code Online (Sandbox Code Playgroud)
现在,我知道有两种方法可以将因子与字符串进行比较,以获得大于的值small:
b %in% c("moderate", "huge")
#> [1] FALSE TRUE TRUE
as.integer(b) > 1
#> [1] FALSE TRUE TRUE
Run Code Online (Sandbox Code Playgroud)
然而,当一个因子中存在多个级别时,第一种方式是乏味的,在这种情况下,我将必须列出所有合格的级别.另一方面,第二种方式并不直观.
在PostgreSQL中,您可以定义一个enum类似于factorR …