学习记录——Octave Convolution、LSK

chatgpt/2023/9/27 16:12:31

Octave Convolution

2019 ICCV
自然世界中的图像存在高低频,卷积层的输出特征图以及输入通道,也都存在高、低频分量。 低频分量支撑的是整体轮廓,高频分量则关注细节,显然,低频分量是存在冗余的,在编码过程中可以节省。

  • 高频到高频的卷积核
  • 高频到低频的卷积核
  • 低频到高频的卷积核
  • 低频到低频的卷积核

下图直观地展示了八度卷积的卷积核,可以看出四个部分共同组成了大小为 k*k 的卷积核。其中,in和out分别表示输入和输出特征图的相关属性,在这篇文章中,输入的低频占比、通道数量都和输出的一致。

在这里插入图片描述
八度卷积的思想是为处理输入数据提供两个单独的路径:一个用于高频(细粒度)信息,另一个用于低频(粗粒度)信息。这可以通过使用两组卷积层来实现,每组卷积层具有不同的过滤器大小和步幅,其中一个路径在较低空间分辨率(下采样)下操作,另一个在较高空间分辨率(保持原始分辨率或轻微下采样)下操作。
在这里插入图片描述

Large Selective Kernel Network for Remote Sensing Object Detection

ICCV 2023

最近关于遥感物体检测的研究主要集中在改进旋转包围框的表示方法上,但忽略了遥感场景中出现的独特的先验知识。这种先验知识是非常重要的,因为微小的遥感物体可能会在没有参考足够长距离背景的情况下被错误地检测出来,而不同类型的物体所要求的长距离背景可能会有所不同。在本文中,我们将这些先验因素考虑在内,并提出了Large Selective Kernel Network(LSKNet)。LSKNet可以动态地调整其大空间感受野,以更好地建模遥感场景中各种物体的测距的场景。
在这里插入图片描述

  • 准确检测遥感图像中的物体往往需要广泛的背景信息
  • 不同类型的物体所需的上下文信息的范围非常不同。

动态调整特征提取骨干的感受野,以便更有效地处理被检测物体的不同的广泛背景。这是通过一个空间选择机制来实现的,该机制对一连串的大depth-wise卷积核所处理的特征进行有效加权,然后在空间上将它们合并。这些核的权重是根据输入动态确定的,允许该模型自适应地使用不同的大核,并根据需要调整空间中每个目标的感受野。
在这里插入图片描述

LSK

在这里插入图片描述
上图展示了一个LSKNet Bolck的图示,是主干网中的一个重复块,其灵感来自ConvNeXt, PVT-v2, VAN, Conv2Former 和 MetaFormer。每个LSKNet块由两个剩余子块组成:大核选择(LK Selection)子块和前馈网络(FFN)子块。LK选择子块根据需要动态地调整网络的感受野。前馈网络子块用于通道混合和特征细化,由一个全连接层、一个深度卷积、一个GELU激活和第二个全连接层组成的序列。核心模块LSK Module被嵌入到LK选择子块中。它由一连串的大内核卷积和一个空间内核选择机制组成。

End

以上仅作个人学习记录使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-5314365.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

pgsql 查看某个表建立了那些索引sql

执行以下sql: SELECTns.nspname as schema_name,tab.relname as table_name,cls.relname as index_name,am.amname as index_type,idx.indisprimary as is_primary,idx.indisunique as is_unique FROMpg_index idx INNER JOIN pg_class cls ON cls.oididx.indexrel…

为什么不推荐用 index 做 key

之所以添加key属性,究其根本是因 diff算法。而在业务开发过程中特别是使用map, forEach 等遍历函数的时候往往随手就将index做为组件的key. 那么:key 到底有什么用? 当 Vue.js 用 v-for 正在更新已渲染过的元素列表时,它默认用就地复用策略 …

红队打靶:FourAndSix2.01打靶思路详解(vulnhub)

目录 写在开头 第一步:主机发现与端口扫描 第二步:NFS渗透 第三步:7z压缩包的密码破解 第四步:ssh私钥登录 第五步:lessvi提权 总结与思考 写在开头 本篇博客根据大佬红队笔记的视频进行打靶,详述了…

postcss-pxtorem适配插件动态配置rootValue(根据文件路径名称,动态改变vue.config里配置的值)

项目背景:一个项目里有两个分辨率的设计稿(1920和2400),不能拆开来打包 参考: 是参考vant插件:移动端Vant组件库rem适配下大小异常的解决方案:https://github.com/youzan/vant/issues/1181 说明: 因为vue.c…

C++类与对象 - 4(初始化列表,Static成员,友元,内部类,匿名对象)

类与对象 - 4 1. 再谈构造函数1.1 构造函数体赋值1.2 初始化列表(重点)1.3 explicit关键字 2. Static成员2.1 概念2.2 特性 3. 友元3.1 友元函数3.2 友元类 4. 内部类5.匿名对象 1. 再谈构造函数 1.1 构造函数体赋值 在创建对象时,编译器通过…

目标检测算法——YOLOv5/YOLOv7改进之结合​ASPP(空洞空间卷积池化金字塔)

&#x1f496;&#x1f496;>>>加勒比海带&#xff0c;QQ2479200884<<<&#x1f496;&#x1f496; &#x1f340;&#x1f340;>>>【YOLO魔法搭配&论文投稿咨询】<<<&#x1f340;&#x1f340; ✨✨>>>学习交流 | 温澜潮…

JS 获取元素的大小(高度和宽度)

在 Javascript 中&#xff0c;使用下面3组属性可以获取元素的高度和宽度。如图所示。 元素尺寸属性说明clientWidth获取元素可视部分的宽度&#xff0c;即 css 的 width 和 padding 属性值之和&#xff0c;元素边框和滚动条不包括在内&#xff0c;也不包含任何可能的滚动区域c…

Build CUDA from Source

This is a note for Blog-1 and Blog-2: git clone gitgithub.com:TimDettmers/bitsandbytes.git cd bitsandbytes export CUDA_HOME/usr/local/cuda-12.1 && make cuda12x CUDA_VERSION121 export CUDA_HOME/usr/local/cuda-12.1 && make cuda12x_nomatmul
推荐文章