自己回顾yolov2算法,并做个笔记进行巩固。
YOLOV2
相较yolov1做的改进具体一一说明。
Better
batch normalization
回顾一下批归一化的作用:
有助于解决反向传播中梯度消失以及梯度爆炸的问题,
降低对一些超参数的敏感性
带来的正则化效果使得获得更好的收敛效果
做法:在卷积后全部加入bn, 即由原来的卷积激活结构变为卷积、批标准化、激活。
效果:mAP提升2%
hi-res classifier
用更高分辨率的图像微调分类模型
YOLOV1:ImageNet的图像分类训练输入为224×224,检测时用的是448×448。
YOLOV2:ImageNet的图像分类预训练输入为224×224,再采用448×448样本对分类模型微调(10个epoch), 然后再使用448×448样本进行检测
效果:mAP提升4%
anchor box
采用类似rcnn的anchor box来作为参考框,将目标检测转换为对参考框的判断:是不是包含目标,偏移量是多少。
YOLOV1:7×7×2=98
YOLOV2:13×13×5=845
聚类提取anchor尺度
Faster-rcnn:手动指定anchor比例,不一定完全适合数据集
YOLOV2:对训练集中标注的边框进行聚类寻找到边框尺寸