【读一本书】《昇腾AI处理器架构与编程》--神经网络基础知识(2)
1 卷积神经网络:输入层
之前提到多层感知机的参数太多,导致训练耗时长并且对图像处理也不具有优势,因此大神们 就提出了多层神经网络,其中最经典的是卷积神经网络(Convolution Neural Network, CNN)。
一般 CNN网络分为输入层、卷积层、池化层、全连接层及输出层。以CNN中最经典的LeNet5网络结构来说明。LeNet5的结构为“输入层--卷积层1--池化层1--卷积层2--池化层2--全连接层1--全连接层2--输出层”,如下图所示:

输入层:主要是对输入数据进行求均值处理,使得样本数据的中心尽量调整到坐标系原点,包括将数据输出成特定格式,通过主成分分析PCA进行降维。总的来说,就是把输入数据尽量弄的少点,但又能代替原数据。
2 卷积神经网络:卷积层
卷积层:通常采用二维卷积计算对图像进行卷积,从而提取输入数据的关键特征,达到增强特征信息,过滤无用信息的目标,并为下一层输出特征图。
1、首先,先讲下关于卷积层的2个概念,一个是卷积核(又叫过滤器),一个是感受野。
卷积核:通过卷积核是 三维矩阵,由宽度、高度、深度三个参数组成。主要用于卷积过程中的加权求和
不同的卷积核效果也不一样 ,有些对颜色信息敏感,有些对图形形状敏感,因此一个CNN网络通常有多个卷积核。
感受野:卷积核作用的卷积窗口对应于原输入特征图的部分

上图为感受野示意图
按我当前的理解,卷积层输出的特征图就是感受野经过卷积核处理后输出的结果。
最后,经过卷积核处理后的输出,还需要通过激活函数处理,类似上次提到的阶跃函数。但是阶跃函数是线性的,而神经元本身也是线性的,因此一般常用的激活函数是sigmoid函数、tanh函数等非线性函数,从而增强神经网络的非线性拟合能力。
2、接着,讲讲卷积层的特性。
(1)局部连接
多层感知机用的是全连接模式,CNN采用的是局部连接模式。怎么理解?就是说在多层感知机里,多一个神经元需要处理同一块感受野;CNN中,一块感受野可能只由一个神经元处理。如下图右边所示。

(2)权重共享
由于每个神经元都有对应的权重数据,导致网络参数太多,无法快速调优网络;因此CNN采用的是权重共享,即所有神经元使用同一份权重数据。如下图右边所示。

3、再讲下卷积层计算方法
一种是直接卷积,就是对特征图进行边缘填充0,进行与权重矩阵相同维数的矩阵进行矩阵乘法。以示例图为例,将特征图外围扩展了一圈0,然后以每次左移的步长为2的频率进行与权重数据矩阵相乘。

▲此为直接卷积
第二种是矩阵乘法实现卷积。通过Img2Col函数将特征图和权重矩阵都展开成可实现相乘的维度,如下图

▲此为矩阵乘法卷积
针对卷积层的计算加速,又有5层层次的并行性,我不太感兴趣,就不去了解了。
书中提到,昇腾AI处理器采用的是矩阵乘法卷积的方式。而卷积层的参数量和计算量一般是神经网络中的重头,因此卷积层的合理设计可以算是一个产品的核心算法。
3 卷积神经网络:池化层
池化层:为了防止过拟合,通过在相邻卷积层之间进入池化处理,减少每一层特征值数目,保留主特征。
一般 池化处理是对不同位置区域提取具有代表性的特征值,如最大值、平均值,对应的池化函数即为最大池化和平均池化。池化层综合了输入特征图周围全部特征信息的反馈和影响,又减少了输出数据量,从而提升了神经网络的计算效率。
(这块技术,好像不是什么核心算法,因为作者也只是简单地带过。)
4 全连接层输出
全连接层相当于一个多层感知机,对不同输入特征进行分类。
5 总结
看了第一章,只能说大致了解了神经网络的概貌,对其中很多的数学公式推导、一些优化处理并没有深入了解。感觉自己看了也会一知半解,容易遗忘,就不去仔细阅读了。
好啦,下次就进入《昇腾AI处理器》的第二单--行业背景,如芯片加速理论、深度学习框架等。
作者:华为云合作开发者 鹏哥贼优秀
【读一本书】《昇腾AI处理器架构与编程》--神经网络基础知识(2)的更多相关文章
- 【转帖】威盛x86 AI处理器架构、性能公布:媲美Intel 32核心
威盛x86 AI处理器架构.性能公布:媲美Intel 32核心 https://www.cnbeta.com/articles/tech/920559.htm 除了Intel.AMD,宝岛台湾的威盛也 ...
- 各个处理器架构ISA编程指南
1.Intel官方文档: http://www.intel.com/content/www/us/en/processors/architectures-software-developer-manu ...
- DeepLearning.ai学习笔记(四)卷积神经网络 -- week1 卷积神经网络基础知识介绍
一.计算机视觉 如图示,之前课程中介绍的都是64* 64 3的图像,而一旦图像质量增加,例如变成1000 1000 * 3的时候那么此时的神经网络的计算量会巨大,显然这不现实.所以需要引入其他的方法来 ...
- AI学习---数据IO操作&神经网络基础
数据IO操作 TF支持3种文件读取: 1.直接把数据保存到变量中 2.占位符配合feed_dict使用 3. QueueRunner(TF中特有的) 文件读取流程 文件读取流程(多线 ...
- AI的自学题库-竞赛-基础知识
阿里云(天池): https://tianchi.aliyun.com/course?spm=5176.12281897.0.0.209439a9UwObn3 天池竞赛:https://tianchi ...
- linux运维、架构之路-linux基础知识
1.PATH环境变量 LANG ——————>变量名字 $LANG ——————>查看变量内容 LANG= ——————>修改变量 系统环境变量填加内容前面使用export expo ...
- 【华为昇腾】 序言:从昇腾AI软硬件平台聊起
2021年是很值得纪念的一年,从上半年开始跟随导师编写有关华为昇腾软件栈CANN的教材,一年的时间反复迭代 终于快要出版了. 这一系列博客可以视作我从编者的角度,重新梳理的全书思路.明年入职商汤之后要 ...
- 用昇腾AI护航“井下安全”
摘要:基于CANN(异构计算架构)打造的"智能矿山安全生产管理平台",能够更便捷和更高效地服务于更多矿山安全生产建设. 本文分享自华为云社区<华为携手云话科技助力矿山智能化, ...
- ARM、X86和AI处理器的区别
ARM.X86和AI处理器的区别 目前主要的处理器架构有: X86: Intel, AMD, 海光, 兆芯 ARM: 华为,飞腾,华芯通,Cavium,Ampere,富士通,亚马逊 POWER:IBM ...
随机推荐
- 使用 Scrapy 爬取去哪儿网景区信息
Scrapy 是一个使用 Python 语言开发,为了爬取网站数据,提取结构性数据而编写的应用框架,它用途广泛,比如:数据挖掘.监测和自动化测试.安装使用终端命令 pip install Scrapy ...
- 深入理解计算机系统 第八章 异常控制流 part2
关于进程,需要关注其提供给应用程序的两个关键抽象: 1.一个独立的逻辑控制流,它提供一个假象,好像我们的程序独占地使用处理器 2.一个私有的地址空间,它提供一个假象,好像我们的程序独占地使用内存系统 ...
- 怎样在PaaS平台上搭建一个会自动关闭的会议室
首相得解释一下,什么叫做会自动关闭的会议室.我们的会议室是存在一个会议预定系统的,一般情况下,我们需要开会的时候,需要先抢占会议室.等待要开会的时候,去会议室里边开会,如果里边有别人,我们可以告诉他们 ...
- [LC]747题 Largest Number At Least Twice of Others (至少是其他数字两倍的最大数)
①中文题目 在一个给定的数组nums中,总是存在一个最大元素 . 查找数组中的最大元素是否至少是数组中每个其他数字的两倍. 如果是,则返回最大元素的索引,否则返回-1. 示例 1: 输入: nums ...
- 基于@Scheduled注解的Spring定时任务
1.创建spring-task.xml 在xml文件中加入命名空间 <beans xmlns="http://www.springframework.org/schema/beans& ...
- Spring Bean的定义及作用域
目录: 了解Spring的基本概念 Spring简单的示例 Bean的定义 简单地说Bean是被Spring容器管理的Java对象,Spring容器会自动完成对Bean的实例化. 那么什么是容器呢?如 ...
- 力扣(LeetCode)删除排序链表中的重复元素 个人题解
给定一个排序链表,删除所有重复的元素,使得每个元素只出现一次. 这题思路比较简单,同样是快慢针的思路. 用一个整数类型val对应最新的只出现过一次的那个值, 如果节点的下一个节点的值和这个对应则不做别 ...
- ZeroC ICE的远程调用框架 Callback(一)-AMI异步方法调用框架
Ice框架提供了不少回调设施,其中一些是使用Ice远程调用进行ami模式或amd模式的支撑.本篇来看一下用于代理端的回调设施. Ice代码中有好几个Callback相关命名的基类,并且slice还会为 ...
- 在linux系统下进行pip升级注意事项
今天鼓捣爬虫的时候需要用pip安装beautifulsoup4,但是出现了错误,说我的pip版本太低,需要升级一下.刚开始我用了下面这段代码: pip install --upgrade pip 显示 ...
- Roarctf 几道pwn 复现
1.easy_pwn 可以利用的点: __int64 __fastcall sub_E26(signed int a1, unsigned int a2) { __int64 result; // r ...