文章目录
- 前言
- v3
- 改动
- backBone
- 先验框的设定改变
- 特征图的提取
- loss函数的修改
- softmax 改进
- MSE 和交叉熵损失函数
前言
- v1和v2可以参考前两篇文章
- v1:https://blog.csdn.net/monk96/article/details/126603180?spm=1001.2014.3001.5502
- v2:https://blog.csdn.net/monk96/article/details/126605169?spm=1001.2014.3001.5502
v3
论文参考:https://arxiv.org/pdf/1804.02767.pdf
大v参考:https://zhuanlan.zhihu.com/p/76802514
v3 和v2 大体上的思路是差不多的, 做了一些细节上的修改。
改动
- 提取网络的改变 Backbone
- 先验框的改变
- 特征图的提取,特征融合(金字塔特征)
- loss函数的改变
- softmax的改变
别急, 一个个来
backBone
论文中这样说:
This new network is much more powerful than Darknet19 but still more efficient than ResNet-101 or ResNet-152.
Here are some ImageNet results:
这边的网络是基于darknet-19上进行改进的,融合了resnet ,叫darknet。
先验框的设定改变
论文中提到:
v3 中沿用了v2的kmeans提取bounding-box, 为9种, 3个大,中,小。
特征图的提取
这边用了concat 替代了加和操作,目的在于concat可以融合特征图,如25625616 concat 25625616 = 25625632
每个特征图维度为 85
loss函数的修改
对于x, y, w, h ,引入了均方误差损失。
对于二分类问题, 引入了交叉熵损失函数。
softmax 改进
把常用的单分类, 设计成多类别
MSE 和交叉熵损失函数
https://zhuanlan.zhihu.com/p/95386061