DetNet原理及其PyTorch实现

2020年06月26日 4点热度 0人点赞 0条评论

VGGNet和ResNet等网络骨架,虽从各个角度出发提升了物体检测性能,但就究其根本是为ImageNet的图像分类任务而设计的。而图像分类与物体检测两个任务天然存在着落差,分类任务侧重于全图的特征提取,深层的特征图分辨率很低;而物体检测需要定位出物体位置,特征图分辨率不宜太小,因此造成了以下两种缺陷:

1)大物体难以定位:对于FPN等网络,大物体对应在较深的特征图上检测,由于网络较深时下采样率较大,物体的边缘难以精确预测,增加了回归边界的难度。

2)小物体难以检测:对于传统网络,由于下采样率大造成小物体在较深的特征图上几乎不可见;FPN虽从较浅的特征图来检测小物体,但浅层的语义信息较弱,且融合深度特征时使用的上采样操作也会增加物体检测的难度。

针对以上问题,旷世科技提出了专为物体检测设计的DetNet结构,引入了空洞卷积,使得模型兼具较大感受野与较高分辨率,同时避免了FPN的多次上采样,实现了较好的检测效果。

DetNet的网络结构如图1所示,仍然选择性能优越的ResNet-50作为基础结构,并保持前4个stage与ResNet-50相同,具体的结构细节有以下3点:

隐藏内容需要支付:¥5
查看全部
未经允许不得转载!DetNet原理及其PyTorch实现

update

纸上得来终觉浅, 绝知此事须躬行。