理解卷积神经网络中的输入与输出形状(Keras实现)

人工智能遇见磐创 2024-08-28 07:17:31 原文

即使我们从理论上理解了卷积神经网络，在实际进行将数据拟合到网络时，很多人仍然对其网络的输入和输出形状(shape)感到困惑。本文章将帮助你理解卷积神经网络的输入和输出形状。

让我们看看一个例子。CNN的输入数据如下图所示。我们假设我们的数据是图像的集合。

输入的形状

你始终必须将4D数组作为CNN的输入。因此，输入数据的形状为(batch_size，height，width，depth)，其中第一维表示图像的batch大小，其他三个维表示图像的各个属性，即高度，宽度和深度。深度就是色彩通道的数量。例如，RGB图像的深度为3，而灰度图像的深度为1。

输出形状

CNN的输出也是4D数组。其中batch大小将与输入batch大小相同，但是图像的其他3个尺寸可能会根据滤波器(filter) ，内核大小(kernel size)和填充值(padding)而变化。

让我们看一下下面的代码片段。

不要在这里被input_shape参数欺骗，以为输入形状是3D，但是在进行训练时必须传递一个4D数组，该数据的形状应该是(batchsize，10，10，3)。由于inputshape参数中没有batch值，因此在拟合数据时可以采用任何batch大小。

而且正如你所见，输出的形状为(None，10，10，64)。第一个维度表示batch大小，目前为"None"。因为网络事先不知道batch大小。拟合数据后，将使用拟合数据时给出的batch大小来代替"None"。

让我们看看另一个代码片段。

在这里，我将inputshape参数替换为batchinput_shape。顾名思义，此参数将事先提供batch大小，并且在拟合数据时你无法提供任何其他batch大小。例如，在本例你必须用batch大小为16的数据来拟合网络。

你可以从上图看到输出形状的batch大小是16而不是None。

在卷积层上附加全连接(Dense)层

我们可以简单地在另一个卷积层的顶部添加一个卷积层，因为卷积的输出维度数与输入维度数相同。

通常，我们在卷积层的顶部添加Dense层以对图像进行分类。但是，Dense层需要形状为(batch_size，units)的数据。卷积层的输出是4D的数组。因此，我们必须将从卷积层接收的输出的尺寸更改为2D数组。

我们可以通过在卷积层的顶部插入一个Flatten层来做到这一点。Flatten层将3维图像变形成一个维。现在我们得到一个2D形状的数组(batchsize，squashedsize)，这是Dense层需要的输入形状。

汇总

你始终必须将形状为(batch_size, height, width, depth)的4D数组输入CNN。
CNN的输出数据也是形状(batch_size, height, width, depth)的4D数组。
要在CNN层的顶部添加一个Dense层，我们必须使用keras的Flatten层将CNN的4D输出更改为2D。

欢迎关注磐创博客资源汇总站：http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站：http://pytorch.panchuang.net/

理解卷积神经网络中的输入与输出形状(Keras实现)的更多相关文章

理解卷积神经网络中的channel
在一般的深度学习框架的 conv2d 中,如 tensorflow.mxnet,channel 都是必填的一个参数在 tensorflow 中,对于输入样本中 channels 的含义,一般是RGB ...
CNN笔记：通俗理解卷积神经网络【转】
本文转载自:https://blog.csdn.net/v_july_v/article/details/51812459 通俗理解卷积神经网络(cs231n与5月dl班课程笔记) 1 前言 2012 ...
CNN笔记：通俗理解卷积神经网络
CNN笔记:通俗理解卷积神经网络 2016年07月02日 22:14:50 v_JULY_v 阅读数 250368更多分类专栏: 30.Machine L & Deep Learning 机 ...
卷积神经网络中的通道 channel
卷积神经网络中 channels 分为三种: (1):最初输入的图片样本的 channels ,取决于图片类型,比如RGB, channels=3 (2):卷积操作完成后输出的 out_c ...
卷积神经网络中的Winograd快速卷积算法
目录写在前面问题定义一个例子 F(2, 3) 1D winograd 1D to 2D,F(2, 3) to F(2x2, 3x3) 卷积神经网络中的Winograd 总结参考博客:blog ...
（转）MyBatis框架的学习(四)——Mapper.xml文件中的输入和输出映射以及动态sql
http://blog.csdn.net/yerenyuan_pku/article/details/71893689 前面对MyBatis框架的学习中,我们对Mapper.xml映射文件多少有些了解 ...
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图因为很多 demo 都比较复杂,专门抽出这两个函数,写的 demo. 更多教程:http://www.tensorflown ...
卷积神经网络中的channel 和filter
在深度学习的算法学习中,都会提到 channels 这个概念.在一般的深度学习框架的 conv2d 中,如 tensorflow .mxnet,channels 都是必填的一个参数. channels ...
python中的输入和输出
输入和输出输出: 用print()在括号中加上字符串,就可以向屏幕上输出指定的文字.比如输出'hello, world',用代码实现如下: >>> print('hello, ...

随机推荐

一天速成Python教程
一.Python基础 Python是对象有类型,变量无类型的动态类型语言,追求简单优雅易读.可以在终端中逐行运行,也可以编写成大型的面向对象的工程.在开始写之前,注意Python 2.X中,开头要写上 ...
date成字符串
//获取当前时间 Date date=new Date(); System.out.println("当前date: "+date); //将时间转化成yyyy-MM-dd格式的字 ...
Deepin环境下启动Pycharm没有启动图标解决办法
小伙伴们在deepin下运行pycharm时,是不是需要通过sh文件启动? 下面告诉大家如何将pycharm图标放在桌面上: 1.在桌面打开终端,输入命令: sudo gedit /usr/share ...
Jessica's Reading Problem POJ - 3320
Jessica's Reading Problem Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 17562 Accep ...
idea创建简单web项目分析Servlet的请求转发与重定向的区别
注:如需转载,请附上原文链接,如有建议或意见,欢迎批评指正! 需求说明: // index.jsp页面 1 <% 2 String basePath = request.getScheme() ...
JS中面向对象中的继承（常用写法）---核心部分
1.基本概念子类继承父类,但是不能影响父类.包括1.混合继承(构造函数+原型) 2.ES6新增class的继承. 接下来介绍,面向对象中继承的两种常用写法.即混合继承(构造函数+原型)和class继 ...
IOS7下，alertView不能使用addSubview添加textField解决办法
UIAlertView *alertView1 = [[UIAlertView alloc] initWithTitle:@"Enter Form Name" message:@& ...
C++ 标准模板库(STL)-stack
主要介绍一下C++11版本中标准模板库中栈的用法,希望可以帮到需要用的人. #include <iostream> #include <stack> #include < ...
HTML5&CCS3（2）处理网页文件
2.1 规划网站为什么要创建这个站点,需要展示的内容是什么? 应该如何调整内容使之吸引期望的访问者? 需要多少个页面?网站的结构是怎样? 为页面.图像和其他外部文件设计一个简单且一致的命名规则. 2 ...
vue列表中表单的验证
先上效果图: 在点击确认的时候会验证带有验证的字段嵌套逻辑: 表单表格表格项表单项表单项表格项表格表单代码部分: <!-- 注意此处的model,需要一个对象,而我们的数据是一 ...