0%

yolov2解读笔记

自己回顾yolov2算法,并做个笔记进行巩固。

YOLOV2

相较yolov1做的改进具体一一说明。

Better

batch normalization

回顾一下批归一化的作用:

  • 有助于解决反向传播中梯度消失以及梯度爆炸的问题,

  • 降低对一些超参数的敏感性

  • 带来的正则化效果使得获得更好的收敛效果

做法:在卷积后全部加入bn, 即由原来的卷积激活结构变为卷积、批标准化、激活。

效果:mAP提升2%

hi-res classifier

用更高分辨率的图像微调分类模型

YOLOV1:ImageNet的图像分类训练输入为224×224,检测时用的是448×448。

YOLOV2:ImageNet的图像分类预训练输入为224×224,再采用448×448样本对分类模型微调(10个epoch), 然后再使用448×448样本进行检测

效果:mAP提升4%

anchor box

采用类似rcnn的anchor box来作为参考框,将目标检测转换为对参考框的判断:是不是包含目标,偏移量是多少。

YOLOV1:7×7×2=98

YOLOV2:13×13×5=845

聚类提取anchor尺度

Faster-rcnn:手动指定anchor比例,不一定完全适合数据集

YOLOV2:对训练集中标注的边框进行聚类寻找到边框尺寸