我训练自定义对象检测使用面膜RCNN在TensorFlow目标检测。因此,我要预测对象实例遮罩以及边界框。
预训练模型: mask_rcnn_inception_v2_coco
以下是我训练的快照。
INFO:tensorflow:全局步骤4181:损耗= 0.0031(3.290秒/步)
INFO:tensorflow:全局步骤4181:损耗= 0.0031(3.290秒/步)
INFO:tensorflow:全局步骤4182:损耗= 0.0030(2.745秒/步)
INFO:tensorflow:全局步骤4182:损耗= 0.0030(2.745秒/步)
在这种情况下,您能告诉我这是什么损失吗?
我的问题与训练损失及其导致的损失无关。
我只是不清楚在训练Mask RCNN时这种损失意味着什么?在遮罩RCNN中,最后一层有3个平行磁头,
在这种情况下,损失是什么?
Mask R-CNN纸的损失函数结合了3个损失的加权总和(3个输出):分类,定位和分割掩模:
分类和边界框(本地化)损失与Faster R-CNN中的损失相同。
添加的是掩模的每个像素的S型+二进制损失。mask分支为每个班级生成一个掩码,而各班级之间没有竞争(因此,如果您有10个班级,mask分支将预测10个掩码)。使用的损耗是每个像素的S形+二进制损耗。
如果您想更深入地了解蒙版损失,本文指出:“多项式蒙版与独立蒙版:蒙版R-CNN将蒙版和类别预测分离开来:当现有的框分支预测类别标签时,我们会生成一个蒙版对于每个类别,没有类别之间的竞争(通过每个像素的S形和二进制损失)。在表2b中,我们将此与使用每个像素的softmax和多项式损失(在FCN [30]中常用)进行了比较。”
您可以在论文的第6页,表编号2.b(“多项式与独立掩码”)中看到它。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句