深度学习入门基础CNN系列——感受野和多输入通道、多输出通道以及批量操作基本概念

news/2023/5/28 6:41:28

本篇文章主要讲解卷积神经网络中的感受野和通道的基本概念,适合于准备入门深度学习的小白,也可以在学完深度学习后将其作为温习。

如果对卷积计算没有概念的可以看本博主的上篇文章深度学习入门基础CNN系列——卷积计算

一、感受野(receptive field)

这里先给出概念,感受野:在卷积神经网络CNN中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野(receptive field)。
输出特征图上每个点的数值,是由输入图片上大小为kh×kwk_h\times k_wkh×kw的区域的元素与卷积核对应每个元素相乘再相加得到的,所以输入图像上kh×kwk_h\times k_wkh×kw区域内每个元素数值的改变,都会影响输出点的像素值。==我们将这个区域叫做输出特征图上对应点的感受野。==感受野内每个元素数值的变动,都会影响输出点的数值变化。比如3×33\times33×3卷积对应的感受野大小就是3×33\times33×3,如下图所示:
在这里插入图片描述
而通过两层3×33\times33×3卷积之后,感受野的大小将会增加到5×55\times55×5,如下图所示:
在这里插入图片描述
因此,当增加卷积网络深度的同时,感受野将会增大,输出特征图中的一个像素点将会包含更多的图像语义信息。

二、多输入通道、多输出通道和批量操作

前面几篇文章的卷积计算过程比较简单,实际应用时,处理的问题要复杂的多。例如:对于彩色图片有RGB三个通道,需要处理多输入通道的场景。输出特征图往往也会具有多个通道,而且在神经网络的计算中常常是把一个批次的样本放在一起计算,所以卷积算子需要具有批量处理多输入和多输出通道数据的功能,下面将分别介绍这几种场景的操作方式。

2.1 多输入通道场景

在上面的例子中,卷积层的数据是一个2维的数组,但实际上一张图片往往含有RGB三个通道,要计算卷积的输出结果,卷积核的形式也会发生改变,假设输入图片的通道数为CinC_{in}Cin,输入数据的形式是Cin×Hin×WinC_{in}\times H_{in}\times W_{in}Cin×Hin×Win,计算过程如下图所示。
在这里插入图片描述
步骤如下:

  1. 对每个通道分别设计一个2维数组作为卷积核,卷积核数组的形状为Cin×Kh×KwC_{in}\times K_{h} \times K_{w}Cin×Kh×Kw
  2. 对任意一个通道Cin∈[0,Cin)C_{in} \in [0,C_{in})Cin[0,Cin),分别用大小为kh×kwk_{h}\times k_{w}kh×kw的卷积核在大小为Hin×WinH_{in}\times W_{in}Hin×Win的二维数组上做卷积。
  3. 将这CinC_{in}Cin个通道的计算结果相加,得到的是一个形状为Hout×WoutH_{out}\times W_{out}Hout×Wout的二维数组。

2.2 多输出通道场景

一般来说,卷积操作的输出特征图也会具有多个通道CoutC_{out}Cout,这时候我们需要设计CoutC_{out}Cout个维度为Cin×kh×kwC_{in} ×k_{h} ×k_{w}Cin×kh×kw的卷积核,卷积核数组的维度是Cout×Cin×kh×kwC_{out}\times C_{in}\times k_h \times k_wCout×Cin×kh×kw,如下图所示:
在这里插入图片描述
步骤如下:

  1. 将任意一输出通道Cout∈[0,Cout]C_{out}\in[0,C_{out}]Cout[0,Cout],分别使用上面描述的形状为Cin×kh×kwC_{in} ×k_{h} ×k_{w}Cin×kh×kw的卷积核对输入图片进行卷积。
  2. 对这CoutC_{out}Cout个形状为Hout×WoutH_{out}\times W_{out}Hout×Wout

说明:
通常将卷积核的输出通道数叫做卷积核的个数。

2.3 批量操作

在卷积神经网络的计算中,通常将多个样本放在一起形成一个mini-batch进行批量操作,即输入数据的维度是 N×Cin×Hin×WinN\times C_{in}\times H_{in}\times W_{in}N×Cin×Hin×Win。由于会对每张图片使用同样的卷积核进行卷积操作,卷积核的维度与上面多输出通道的情况一样,仍然是Cout×Cin×kh×kwC_{out}\times C_{in}\times k_h \times k_wCout×Cin×kh×kw,输出特征图的维度是N×Cout×Hout×WoutN\times C_{out} \times H_{out} \times W_{out}N×Cout×Hout×Wout,如下图所示:

在这里插入图片描述

附:
深度学习入门基础CNN系列——填充(padding)与步幅(stride)
深度学习入门基础CNN系列——卷积计算

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-4556088.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

一个有关未来十年的预言

各位浅友们大家好。俗话说,上有天堂,下有保定。所以中哥,来了重庆。因为在这里举办了一场“智博会”。这次大会的全称是“智能博览会”,所以中国有头有脸的科技大佬,马云、马化腾、李彦宏、史中等等都来到了这里。据说…

一个关于未来十年的预言

一个有关未来十年的预言 各位浅友们大家好。 俗话说,上有天堂,下有保定。所以中哥,来了重庆。 因为在这里举办了一场“智博会”。这次大会的全称是“智能博览会”,所以中国有头有脸的科技大佬,马云、马化腾、李彦宏…

哎!2019年最后1天,我从外包公司辞职了...

「 读者福利!2 TB 各类技术资源免费赠送 」作者:张林-布莱恩特来源:https://www.cnblogs.com/zhangmumu/p/12117400.html马上就要2020年,2019这段路你走的辛苦吗?这日子过的可真快啊,2019年还剩1天&#xf…

我从外包公司离职了(一定要看 防坑指南)!

点击“Python编程与实战”,选择“置顶公众号”第一时间获取 Python 技术干货!马上就要2020年,2019这段路你走的辛苦吗?这日子过的可真快啊,2019年还剩1天,外包公司干了不到3个月,我离职了......…

商城小程序的引流方法

尽管小程序在二零一七年就发布上线,但是它在二零一九年以后才开始慢慢火起来,小程序的使用率迅速增长,并且微信小程序被广泛应用于各个方面。微信小程序做为一个易散播且有利于随身携带的轻经营模式受到了大家的欢迎。因而定制开发小程序商城…

引流的方法有哪些?所有的引流,都离不开这二种方法!

在互联网上,不管是做什么项目,前提一定是要有稳定的流量。在运营的过程中,流量就是前端的事情,后端的事情则是变现,如果说一个项目没有任何流量,那么就没有办法实现变现,而整个项目就是竹篮打水…

扫码器:壹码通(EMT 6621)二维码带多个回车换行处理

摘要:二维码运用越来越广泛了,目前在医院中一个二维码可以串联多个系统,二维码的内容也可以设置一些特殊字符去达成系统便捷性。本次遇到为二维码中开头内置了回车和空格,在程序判断为回车(KEY_ENTER)时就会触发业务逻辑&#xff…

在线教育产品的引流方法

在线教育获客成本高已经是人尽皆知的事情了,随着互联网流量愈发昂贵,不少教育产品又开始布局线下渠道了,那么线下流量与线上流量在获取方式上有哪些不同,以及殊途同归的点呢? 线下流量的获取 线下流量的获取主要靠场…

新媒体运营引流方法

在运营新媒体的时候,你是不是也曾经被老板和客户问过这样的问题:到底该如何引流?你怎么为我吸引阅读者,如何吸引意向客户?如果你面对这些问题总感觉束手无策,今天就教给您新媒体运营最常见的引流方法,帮助你引爆新媒体运营账号。…

【错误记录】Kotlin 代码运行时报错 ( 在 init 初始化块中调用还未初始化的成员属性 )

文章目录一、报错信息二、问题分析三、解决方案该问题的本质就是 , 成员属性 在 init 初始化代码块中进行初始化 , 但是在初始化之前调用了该 成员属性 , 编译时没有报错信息 , 但是运行时会报异常 ; 一、报错信息 执行如下代码 : class Hello {var name: Stringfun nameFirst…

18对个人财富的窥视——对一款手机木马的解读及分析

今年的3.15晚会异常精彩,网络安全不再离我们那么遥远,智能硬件漏洞、淘宝刷单等已经开始影响我们的生活,如果您不懂网络安全专业知识,没有关系,但必须得有安全意识和安全常识,经常听到周围很多朋友的朋友被骗**万,什么手机短信诈骗,什么冒充公检法欺诈,什么冒充家长转…

你被窥视了吗?清醒看移动应用程序隐私保护

位于华盛顿特区的智囊团——未来隐私论坛,本周发布的一份研究详细说明了在2012年6月,移动应用的隐私保护政策的状态。该报告发现,在移动应用的隐私保护问题上,许多应用程序开发商,正在面对日益加大的来自美国监管机构的…

从 “求最大公约数” 窥视数学,编程和算法

算法,讲究一个巧字: 最近一直在研究算法的内容,但是我发现了一个问题,那就是在学习的时候会有一种迷茫的感觉,有时候会分不清编程和算法的关系,有时候会分不清算法和数学的关系,在这里贴出一些我的小感悟&a…

网络管理必备工具软件精解(Windows版)---转载及个人见解

网络管理必备工具软件精解(Windows版)出版社: 人民邮电出版社作者: 刘晓辉 王淑江出版日期:2006年3月国标编号:ISBN 7-115-14546条形码: 字数:899千字  印张:28.25 印数: 1-5000 页码: 443 开本:787*1092版别版次:2006年3月第1版第1次印刷内容提…

Hyper-V三种虚拟网络类型的理解

Windows 10除家庭版之外都内置了Hyper-V,但是Win10系统上Hyper-V虚拟网络的设置方法却与之前版本的Hyper-V有些不同,最近在折腾了无数遍之后,总算有些心得:先说说虚拟网络的三种类型。Hyper-v支持外部、内部、专用三种网络&#x…

我们的工作方式:窥视Envato Tuts +团队的生活

今天,我们为您提供一个机会,在Envato Tuts 的后台进行幕后探访,并结识为您带来所有这些教程和课程的编辑。 我们是21世纪的一支庞大的员工队伍:遍布全球,在家工作,工作时间完全不同,并通过Trel…

java基础理论学习笔记(1)——volatile

首先借用阳哥的脑图: 1、轻量级:是相对jvm的三个特性,volatile只实现了可见性、有序性来说的。 2、可见性: 如下图:线程工作时,会从堆中(主内存)里拷贝变量age25到各自栈中(工作内…

灵遁者油画作品《窥探》

灵遁者油画作品《窥探》。尺寸:7070cm 百科说:人性狭义上是指人的本质心理属性,也就是人之所以为人的那一部分属性,是人与其它动物相区别的属性;广义上是指人普遍所具有的心理属性,其中包括人与其它动物所共…

Redis删除了大量数据后,为什么内存占用还是很高?

前言 上周刚来了个应届小师弟,组长说让我带着,周二问了我这样一个问题:师兄啊,我用top命令看了下服务器的内存占用情况,发现Redis内存占用严重,于是我就删除了大部分不用的keys,为什么内存占用…

即时通讯开发之TCP 交互数据流、成块数据流

目前建立在 TCP 协议上的网络协议特别多,有 telnet,ssh,有 ftp,有 http 等等。 这些协议又可以根据数据吞吐量来大致分成两大类: 交互数据类型:例如 telnet,ssh,这种类型的协议在大多数情况下只是做小流量的数据交换,比如说按一下键盘,回显一些文 字等等。 数据…