理解卷积神经网络中的输入与输出形状(Keras实现)

人工智能遇见磐创 2024-08-28 07:17:31 原文

即使我们从理论上理解了卷积神经网络，在实际进行将数据拟合到网络时，很多人仍然对其网络的输入和输出形状(shape)感到困惑。本文章将帮助你理解卷积神经网络的输入和输出形状。

让我们看看一个例子。CNN的输入数据如下图所示。我们假设我们的数据是图像的集合。

输入的形状

你始终必须将4D数组作为CNN的输入。因此，输入数据的形状为(batch_size，height，width，depth)，其中第一维表示图像的batch大小，其他三个维表示图像的各个属性，即高度，宽度和深度。深度就是色彩通道的数量。例如，RGB图像的深度为3，而灰度图像的深度为1。

输出形状

CNN的输出也是4D数组。其中batch大小将与输入batch大小相同，但是图像的其他3个尺寸可能会根据滤波器(filter) ，内核大小(kernel size)和填充值(padding)而变化。

让我们看一下下面的代码片段。

不要在这里被input_shape参数欺骗，以为输入形状是3D，但是在进行训练时必须传递一个4D数组，该数据的形状应该是(batchsize，10，10，3)。由于inputshape参数中没有batch值，因此在拟合数据时可以采用任何batch大小。

而且正如你所见，输出的形状为(None，10，10，64)。第一个维度表示batch大小，目前为"None"。因为网络事先不知道batch大小。拟合数据后，将使用拟合数据时给出的batch大小来代替"None"。

让我们看看另一个代码片段。

在这里，我将inputshape参数替换为batchinput_shape。顾名思义，此参数将事先提供batch大小，并且在拟合数据时你无法提供任何其他batch大小。例如，在本例你必须用batch大小为16的数据来拟合网络。

你可以从上图看到输出形状的batch大小是16而不是None。

在卷积层上附加全连接(Dense)层

我们可以简单地在另一个卷积层的顶部添加一个卷积层，因为卷积的输出维度数与输入维度数相同。

通常，我们在卷积层的顶部添加Dense层以对图像进行分类。但是，Dense层需要形状为(batch_size，units)的数据。卷积层的输出是4D的数组。因此，我们必须将从卷积层接收的输出的尺寸更改为2D数组。

我们可以通过在卷积层的顶部插入一个Flatten层来做到这一点。Flatten层将3维图像变形成一个维。现在我们得到一个2D形状的数组(batchsize，squashedsize)，这是Dense层需要的输入形状。

汇总

你始终必须将形状为(batch_size, height, width, depth)的4D数组输入CNN。
CNN的输出数据也是形状(batch_size, height, width, depth)的4D数组。
要在CNN层的顶部添加一个Dense层，我们必须使用keras的Flatten层将CNN的4D输出更改为2D。

欢迎关注磐创博客资源汇总站：http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站：http://pytorch.panchuang.net/

理解卷积神经网络中的输入与输出形状(Keras实现)的更多相关文章

理解卷积神经网络中的channel
在一般的深度学习框架的 conv2d 中,如 tensorflow.mxnet,channel 都是必填的一个参数在 tensorflow 中,对于输入样本中 channels 的含义,一般是RGB ...
CNN笔记：通俗理解卷积神经网络【转】
本文转载自:https://blog.csdn.net/v_july_v/article/details/51812459 通俗理解卷积神经网络(cs231n与5月dl班课程笔记) 1 前言 2012 ...
CNN笔记：通俗理解卷积神经网络
CNN笔记:通俗理解卷积神经网络 2016年07月02日 22:14:50 v_JULY_v 阅读数 250368更多分类专栏: 30.Machine L & Deep Learning 机 ...
卷积神经网络中的通道 channel
卷积神经网络中 channels 分为三种: (1):最初输入的图片样本的 channels ,取决于图片类型,比如RGB, channels=3 (2):卷积操作完成后输出的 out_c ...
卷积神经网络中的Winograd快速卷积算法
目录写在前面问题定义一个例子 F(2, 3) 1D winograd 1D to 2D,F(2, 3) to F(2x2, 3x3) 卷积神经网络中的Winograd 总结参考博客:blog ...
（转）MyBatis框架的学习(四)——Mapper.xml文件中的输入和输出映射以及动态sql
http://blog.csdn.net/yerenyuan_pku/article/details/71893689 前面对MyBatis框架的学习中,我们对Mapper.xml映射文件多少有些了解 ...
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图因为很多 demo 都比较复杂,专门抽出这两个函数,写的 demo. 更多教程:http://www.tensorflown ...
卷积神经网络中的channel 和filter
在深度学习的算法学习中,都会提到 channels 这个概念.在一般的深度学习框架的 conv2d 中,如 tensorflow .mxnet,channels 都是必填的一个参数. channels ...
python中的输入和输出
输入和输出输出: 用print()在括号中加上字符串,就可以向屏幕上输出指定的文字.比如输出'hello, world',用代码实现如下: >>> print('hello, ...

随机推荐

Salesforce与微信公众号集成实现输入关键字搜索文章
本篇参考微信官方文档:https://developers.weixin.qq.com/doc/offiaccount/Basic_Information/Access_Overview.html 随 ...
IP 地址与MAC硬件地址
IP 地址与MAC硬件地址我们都知道数据通信要使用IP地址加MAC地址,两个地址缺一不可,下为原理图: 1.下面介绍计算机A与计算机B通信的过程交换机基于数据帧的MAC地址转发数据帧,路由器基于数 ...
hadoop地址配置、内存配置、守护进程设置、环境设置
1.1 hadoop配置 hadoop配置文件在安装包的etc/hadoop目录下,但是为了方便升级,配置不被覆盖一般放在其他地方,并用环境变量HADOOP_CONF_DIR指定目录. 1.1.1 ...
使用thymeleaf模板实现博客评论的异步刷新
使用thymeleaf模板实现博客评论的异步刷新最简单的一个要求:用户可以在博客下面进行评论,然后评论后点击提交后直接上传到数据库,并且局部刷新这是前端页面的展示,使用的semanticUI进行构 ...
github浏览器无法访问，并且idea无法push项目
github浏览器无法访问,并且idea无法push项目原因:前一晚还能正常访问github,今天就无法提交项目了.前一步的操作为删库,然后改库.估计是因为dns出现了问题,具体问题不知道. 网上一 ...
WebGIS 利用 WebGL 在 MapboxGL 上渲染 DEM 三维空间数据
毕业两年,一直在地图相关的公司工作,虽然不是 GIS 出身,但是也对地图有些耳濡目染:最近在看 WebGl 的东西,就拿 MapboxGL 做了一个关于 WebGL 的三维数据渲染的 DEMO 练手. ...
前端每日实战：27# 视频演示如何用纯 CSS 创作一个精彩的彩虹 loading 特效
效果预览按下右侧的"点击预览"按钮可以在当前页面预览,点击链接可以全屏预览. https://codepen.io/comehope/pen/vjvoow 可交互视频教程此视频 ...
js事件的三个阶段
js事件的三个阶段分别为:捕获.目标.冒泡 1.捕获:事件由页面元素接收,逐级向下,到具体的元素 2.目标:具体的元素本身 3.冒泡:跟捕获相反,具体元素本身,逐级向上,到页面元素 IE5.5:div ...
【推荐算法工程师技术栈系列】分布式&数据库--tensorflow
目录 TensorFlow 高阶API Dataset(tf.data) Estimator(tf.estimator) FeatureColumns(tf.feature_column) tf.nn ...
IDEA激活码（可用2100年，亲测有效）
三步骤: 1.下载rar包 2.将rar中bin包内容替换IDEA安装目录下bin内容,然后编辑idea.exe.vmoptions和idea64.exe.vmoptions文件,编辑内容一样将最后 ...