My blog in AI ---神经网络,神经元(neural network,nervecell)
尽管我们有很多经验丰富的软件开发人员,但是利用hard code的方法,要解决一些问题,我们的程序员还是优点捉襟见肘,这些问题包括,识别手写数字照片上的数字;分辨一张彩色照片上是否有一只猫咪;准确理解老婆说的“男人说话要是算数,母猪也会上树”这句话的真实含义,等等。这些我们人类处理起来得心应手的问题,计算机程序处理起来却显得很笨拙。
当然,有问题就要去寻找解决方案。其实在很早的时候,我们的计算机科学家前辈们就开始做了这方面的研究,提出的理论和算法有SVM,神经网络等。但是在那个GPU还没有发明,移动互联网还没有普及的年代,相关的算法并不能取得很好的效果,这方面的研究也就没有引起业界的重视。近年来,随着计算机计算能力的增强和大数据时代数据的爆发性增长,神经网络在解决上述问题的过程中取得了非常出色的成绩,例如,像google alpha战胜李世石这样的标志性事件。神经网络在向未来的AI时代开进的过程中,可谓是出尽了风头,前景一片光明。
对于神经网络,全称应该是人工神经网络,是对生物神经网络的模拟。大概的,对生物神经网络的模拟主要分为3个部分,即结构,神经元和突触。首先,我们从神经元聊起。
1神经元
1.1 感知器
要理解一个事物,我感觉最好的办法就是理解他的发展过程。从他的发展历史来看,就能更加深入的理解他为什么是这个样子。
对神经元,我想从感知器聊起。感知器是早期神经网络中的神经元的模型,用来模拟神经元对事件的决策。感知器在上个世纪60年代由Frank Rosenblatt发明,虽然现在使用更为广泛的是S型神经元、ReLU等,但是了解感知器,能够对这门技术的发展有一个更好的理解。
感知器是这样一个简单的模型,如下图所示:

感知器接受若干个输入,产生一个输出,输出的计算方式如下:

, 这是一个向量的形式,表示对所有的输入给不同的权重,输入到感知器中;b是一个阈值(偏置),可以用来表示感知器输出0或者1的难易程度。
例如,我们要用感知器来决策周末要不要去爬山,输入有这么3项,分别为周末的天气晴朗(x1),女朋友想去(x2),有基友相约开黑(x3)。输出1表示要去爬山。
如果我们觉得天气晴朗是最关键的因素,那么我们可以设置w1 = 5, w2=1, w3=-1, b= -1
如果我们觉得有基友约开黑这种事情千万不能错过的话,可以设置权重和偏置为 w1 = 1 w2=1, w3=-5, b= -1
总的来说,通过感知器,设置不同的权重和偏置,我们可以对不同的事情做出不同的决策。通过修改权重和偏置,我们可以找到最适合我们应用的感知器模型,用来解决现实的问题。
但是感知器有它的问题,因为训练神经网络的核心在于得到网络中合适的权重和偏置,通常我们需要不断的调整权重和偏置,使得训练样本的结果不断的接近正确的结果。这就需要一个对权重和偏置的微小调整对输出的影响也是微小的(是不是感觉有点懵,没关系,先跳过,后面介绍了梯度下降和反向传播算法你就豁然开朗了)。我们把输入Z=wx+b, 画出输入与输出的曲线,如图:

从图中可以看出,感知器的曲线是非连续的,在Z=0时有一个阶跃。当我们改变权重和偏置使得Z从正数变成负数或者从负数变成正数时,会对输出造成一个反转。这样会使得神经网络的训练变得非常困难。由此,S型神经元随之提出。
1.2 S型神经元
S型神经元其实与感知器非常的相似,模型也大致如下:

区别在于,S型神经元引入了一个激活函数,sigmoid function, 该函数的定义为:

对S型神经元,可以更为清晰的表示其输出为:

我们先看看S型神经元的曲线:

从图中可以看出,S型神经元是连续的,比感知器要平滑。
S型神经元有很多的优势:
My blog in AI ---神经网络,神经元(neural network,nervecell)的更多相关文章
- 递归神经网络(Recursive Neural Network, RNN)
信息往往还存在着诸如树结构.图结构等更复杂的结构.这就需要用到递归神经网络 (Recursive Neural Network, RNN),巧合的是递归神经网络的缩写和循环神经网络一样,也是RNN,递 ...
- 卷积神经网络(Convolutional Neural Network, CNN)简析
目录 1 神经网络 2 卷积神经网络 2.1 局部感知 2.2 参数共享 2.3 多卷积核 2.4 Down-pooling 2.5 多层卷积 3 ImageNet-2010网络结构 4 DeepID ...
- 深度学习FPGA实现基础知识10(Deep Learning(深度学习)卷积神经网络(Convolutional Neural Network,CNN))
需求说明:深度学习FPGA实现知识储备 来自:http://blog.csdn.net/stdcoutzyx/article/details/41596663 说明:图文并茂,言简意赅. 自今年七月份 ...
- 人工神经网络 Artificial Neural Network
2017-12-18 23:42:33 一.什么是深度学习 深度学习(deep neural network)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高 ...
- [C4] 前馈神经网络(Feedforward Neural Network)
前馈神经网络(Feedforward Neural Network - BP) 常见的前馈神经网络 感知器网络 感知器(又叫感知机)是最简单的前馈网络,它主要用于模式分类,也可用在基于模式分类的学习控 ...
- 详解循环神经网络(Recurrent Neural Network)
本文结构: 模型 训练算法 基于 RNN 的语言模型例子 代码实现 1. 模型 和全连接网络的区别 更细致到向量级的连接图 为什么循环神经网络可以往前看任意多个输入值 循环神经网络种类繁多,今天只看最 ...
- 脉冲神经网络Spiking neural network
(原文地址:维基百科) 简单介绍: 脉冲神经网络Spiking neuralnetworks (SNNs)是第三代神经网络模型,其模拟神经元更加接近实际,除此之外,把时间信息的影响也考虑当中.思路是这 ...
- My blog in AI ---神经网络,网络架构
上一篇博文中,我们介绍了神经网络中的神经元,那么该如何组织起来这些神经元,才能发挥出最好的效果去解决现实中的问题呢? 这是一个复杂的问题,在工程中,神经网络的架构也是训练的也是一种超参数,本节先在理论 ...
- 【原创】深度神经网络(Deep Neural Network, DNN)
线性模型通过特征间的现行组合来表达“结果-特征集合”之间的对应关系.由于线性模型的表达能力有限,在实践中,只能通过增加“特征计算”的复杂度来优化模型.比如,在广告CTR预估应用中,除了“标题长度.描述 ...
随机推荐
- 悲催的IE6 七宗罪大吐槽(带解决方法)第一部分
一.奇数宽高 悲剧的IE6啊,为何有如此多bug,但用户市场又那么大,真让我们搞网站的纠结.今天就遇到了一个非常奇怪但又很细节的一个bug,一个外部的相对定位div,内部一个绝对定位的div(righ ...
- HDU 4548 美素数 在线打表加数状数组
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4548 解题报告:一开始本想先打个素数表,然后每次输入L 跟R 的时候都进行暴力判断,但这题测试数据太多 ...
- G - Pandaland HDU - 6005 (找最小环)
题目链接:https://cn.vjudge.net/contest/275153#problem/G 具体思路: 我们可以按照暴力的方法进行做 , 我们可以枚举每一条边,将这条边的权值设置为inf, ...
- Strusts2笔记8--文件的上传和下载
文件的和上传和下载: (1)文件的上传: Struts是通过拦截器实现文件上传的,而默认拦截器栈中包含了文件上传拦截器,故表单通过Struts2可直接将文件上传,其底层是通过apache的common ...
- 基于NIO的同步非阻塞编程完整案例,客户端发送请求,服务端获取数据并返回给客户端数据,客户端获取返回数据
这块还是挺复杂的,挺难理解,但是多练几遍,多看看研究研究其实也就那样,就是一个Selector轮询的过程,这里想要双向通信,客户端和服务端都需要一个Selector,并一直轮询, 直接贴代码: Ser ...
- 七、springboot整合Spring-data-jpa
1.Spring Data JPA是什么 由Spring提供的一个用于简化JPA开发的框架.可以在几乎不用写实现的情况下,实现对数据的访问和操作.除了CRUD外,还包括如分页.排序等一些常用的功能 1 ...
- Mysql Limit操作
oracle : || mysql: contact contact_ws 拼接 Font Size: Large | Medium | Small select * from tabl ...
- 【h5标签转小程序标签】小程序使用wxParse解析html教程
一.先下载所需文件,下载地址:https://pan.baidu.com/s/1umZO9uI24zUTRd7VqaWbAg ,下载完毕后会得到一个wxParse文件夹,后面会用到: 二.先拷贝cs ...
- Codeforces 963A Alternating Sum(等比数列求和+逆元+快速幂)
题目链接:http://codeforces.com/problemset/problem/963/A 题目大意:就是给了你n,a,b和一段长度为k的只有'+'和‘-’字符串,保证n+1被k整除,让你 ...
- HDU 3861 The King’s Problem(强连通分量+最小路径覆盖)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3861 题目大意: 在csdn王国里面, 国王有一个新的问题. 这里有N个城市M条单行路,为了让他的王国 ...