比YOLOv8还要强的YOLOv6 v3.0

news/2023/6/9 18:54:51

请添加图片描述
论文地址:https://arxiv.org/pdf/2301.05586.pdf
开源地址:https://github.com/meituan/YOLOv6


请添加图片描述


YOLOv6 v3.0的主要贡献简述如下

  1. 对检测器的Neck部件进行了翻新,引入BiC(Bi-directional Concatenation)提供更精确的定位信息;将SPPF简化为SimCSPSPPF,牺牲较少的速度提升更多的性能
  2. 提出一种AAT(Anchor-aided training)策略,在不影响推理效率的情况下同时受益于Anchor-basedAnchor-free设计理念
  3. 对YOLOv6的Backbone与Neck进行加深,在更高分辨率输入下达成新的SOTA性能
  4. 提出一种新的自蒸馏策略提升YOLOv6小模型的性能,训练阶段采用更大的DFL作为增强版辅助回归分支

实现思路

请添加图片描述


Network Design

在网络架构方面,本文主要从Neck与SPP两个维度进行改进

  1. 在Neck方面,本文设计了一种增强的PAN模块,它次用BiC模块对三个近邻层特征进行集成, 这种处理截止可以保留更精确的定位信息,对于小目标定位非常重要
  2. 在SPP方面,本文对YOLOv5 v6.1版本的SPPF进行了简化,得到了所谓的SimCSPSPPF

Anchor-Aided Training

请添加图片描述
YOLOv6是一种追求更高推理速度的Anchor-free检测器

然而,作者发现,在同等配置(YOLOv6-N)下

相比Anchor-free方案,Anchor-based方案可以带来额外的性能增益,见上表

请添加图片描述
有鉴于此,作者提出了AAT策略

它引入了一个Anchor-based辅助分支以组合两种方案的优势

通过这种训练策略,源自的辅助分支的引导信息可以被有效的嵌入到Anchor-free分支

在推理阶段,辅助分支将被移除掉


Self-distillation

在YOLOv6早期版本中,自蒸馏仅在大模型中得到应用,采用的普通KL散度蒸馏

知识蒸馏损失与整体损失定义如下

在这里插入图片描述

超参数α用于对两个损失进行平衡

在训练的早期,源自老师模型的软标签更易于学习

而在训练的后期,学生模型从硬标签中受益更多

因此,作者设计了一种cosine weight decay调整机制

在这里插入图片描述
由于DFL会对回归分支引入额外的参数,极大程度影响小模型的推理速度

因此,作者针对小模型设计了一种DLD(Decoupled Localization Distillation)以提升性能且不影响推理速度

具体来说,在小模型中插入一个增强版回归分支作为辅助

在自蒸馏阶段,小模型受普通回归分支与增强回归分支加持,老师模型近使用辅助分支

需要注意:普通分支仅采用硬标签进行训练,而辅助分支则用硬标签与源自老师模型的软标签进行训练

完成蒸馏后,仅普通分支保留,辅助分支被移除

这种训练策略又是一种加量不加价的"赠品"


实验

请添加图片描述
上表给出了不同方案的性能对比,可以看到

相比YOLOv5-N、YOLOv7-Tiny,YOLOv6-N指标分别提升9.5%、4.2%,同时具有最佳速度

相比YOLOX-S、PPYOLOE-S、YOLOv6-S指标分别提升3.5%、0.9%且速度更快

YOLOv6-M比YOLOv5-M指标高4.6%、速度相当,比YOLOX-M、PPYOLOE-M指标高3.1%、1.0%且速度更快

除了比YOLOv5-L更高更快外,YOLOv6-L比YOLOX-L、PPYOLOE-L分别高3.1%、1.4%且速度相当

相比YOLOv8,YOLOv6在所有尺寸下取得了相当的精度,同时具有更优的吞吐性能

除了上述常规模型尺寸外,作者还进一步提升了输入分辨率并添加了C6特征,与YOLOv5等方案对比

相比YOLOv5系列(即YOLOv5-N6/S6/M6/L6/X6),YOLOv6具有更高的AP、相当的速度

相比YOLOv7-E6E,YOLOv6-L6指标高出0.4%,推理速度快36%

参考文献

  • https://arxiv.org/pdf/2301.05586.pdf

  • https://github.com/meituan/YOLOv6

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-4553960.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

献给迷失的你—一名IT员工的职场心得

http://elevencitys.com/2013/11/%E7%8C%AE%E7%BB%99%E8%BF%B7%E5%A4%B1%E7%9A%84%E4%BD%A0-%E4%B8%80%E5%90%8Dit%E5%91%98%E5%B7%A5%E7%9A%84%E8%81%8C%E5%9C%BA%E5%BF%83%E5%BE%97/ 这些日子我一直在写一个实时操作系统内核,已有小成了,等写完我会全部…

大咖访谈 | 开源社区里各种奇怪的现状——夜天之书陈梓立tison

| 转载自:开源雨林| 责编:沈于蓝| 编辑:姚王薇 本期访谈阵容嘉宾:陈梓立tison,夜天之书作者、Apache Member & 孵化器导师、Apache Flink Committer。主持:庄表伟,开源社理事、华为开源管理…

20 个实例玩转 Java 8 Stream,写的太好了!

上一篇:深夜看了张一鸣的微博,让我越想越后怕先贴上几个案例,水平高超的同学可以挑战一下:从员工集合中筛选出salary大于8000的员工,并放置到新的集合里。统计员工的最高薪资、平均薪资、薪资之和。将员工按薪资从高到…

C生万物 | C语言文件操作指南汇总【内附文件外排序源码】

👑作者主页:Fire_Cloud_1 🏠学习社区:烈火神盾 🔗专栏链接:万物之源——C 文章目录一、为什么使用文件?二、什么是文件?1、程序文件2、数据文件3、文件名三、文件的打开和关闭1、文件…

数据结构学习笔记——图的应用2(拓扑排序、关键路径)

目录一、拓扑排序(一)DAG图和AOV网(二)拓扑排序的概念(三)拓扑排序的步骤(四)拓扑排序的时间复杂度二、逆拓扑排序和DFS算法的应用(一)逆拓扑排序&#xff08…

无限的未知 2003 完整安装版 V6

光盘截图《无限的未知 2003 完整安装版 V6》(以稳定、安全、易用著称的Win2003)发布! 光盘简介★ 使用微软MSDN版本的WindowsServer 2003标准版SP2和企业版SP2进行制作,免激活,可通过正版验证,支持上网更…

网鼎杯2020Crypto题boom

打开题目,发现是一个exe文件,果断ida打开 发现是一个算法,然后得到flag __main();menu();system("pause");system("cls");v7 70;v8 229;v9 239;v10 230;v11 22;v12 90;v13 90;v14 251;v15 54;v16 18;v17 23…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java学毕电设信息采集系统74v6w

最近发现近年来越来越多的人开始追求毕设题目的设创、和新颖性。以往的xx管理系统、xx校园系统都过时了。大多数人都不愿意做这类的系统了,确实,从有毕设开始就有人做了。但是很多人又不知道哪些毕设题目才算是新颖、创意。太老土的不想做,创…