(四)YOLO-V3网络架构(※)
YOLO-V3在网络架构上进行了很大程度的修改,特征提取、先验框以及softmax分类都做了改进,效果极佳,可以称为YOLO系列的巅峰巨作
(1)多scale先验框(多尺度预测)
在V2中为了解决小目标检测的问题,采用特征融合的方式进行改善。在V3中引入3个不同scale,每种scale设置3个不同的先验框,3个scale分别适用于不同大小的特征图,比如较大的特征图的感受野较窄,那么对应较大scale的先验框,就能对小目标进行更好的检测
对于不同的scale,预测的方式有两种。左图为对不同的scale(可以理解为不同大小的特征图层)分别进行预测,即独立地预测大、中、小目标;右图进行了特征融合的工作,比如对于26*26的特征层,将13*13的特征层进行上采样变成26*26,再与26*26的特征层融合,再进行预测任务。很明显第二种方式比较科学,V3版本中采用的就是这样的特征融合。
(2)残差连接
在神经网络各层的连接中,V3借鉴了ResNet中的思想,添加了残差
共有 0 条评论