感知器-从零开始学深度学习

未来将是人工智能和大数据的时代，是各行各业使用人工智能在云上处理大数据的时代，深度学习将是新时代的一大利器，在此我将从零开始记录深度学习的学习历程。

我希望在学习过程中做到以下几点：

了解各种神经网络设计原理。

掌握各种深度学习算法的python编程实现。

运用深度学习解决实际问题。

让我们开始踏上深度度学习的征程。

一、感知器原型

想要了解“神经网络”，我们需要了解一种叫做“感知器”的⼈⼯神经元。感知器在 20 世纪五、六⼗年代由科学家 Frank Rosenblatt 发明,⼀个感知器接受⼏个输⼊，并产⽣⼀个输出。

下图是一个感知器:

⽰例中的感知器有三个输⼊x1、x2、x3（1*w0作为偏置，后面会讲到）。通常可以有更多或更少输⼊。 Rosenblatt 提议⼀个简单的规则来计算输出。他引⼊权重w1、w2、w3..表⽰相应输⼊对于输出重要性的实数（权重）。神经元的输出为0 或者 1，则由计算权重后的总和 ∑jwjxj∑jwjxj

⼩于或者⼤于⼀些阈值决定。和权重⼀样，
阈值是⼀个实数，⼀个神经元的参数。⽤更精确的代数形式：

这就是⼀个感知器所要做的所有事情！
而我们把阖值移动到不等式左边，并用感知器的偏置b=-threshold代替，用偏置而不用阖值。其中实现偏置的一种方法就是如前图所示在输入中引入一个偏置神经元x0=1，则b=x0*w0,那么感知器的规则可以重写为：

此时就可以使用阶跃函数来作为感知器的激励函数。

到此我们可以发现，一个感知器由以下几部分组成

接下去我们将会用一个例子来理解感知器的模型。

模型的建立是运用深度学习方法解决问题的基础。

二、感知器的运用

1、感知器实现逻辑运算

我们设计一个感知器，让它来实现and运算。程序员都知道，and是一个二元函数（带有两个参数和），下面是它的真值表：

x1x1	x2x2	yy
0	0	0
0	1	0
1	0	0
1	1	1

为了计算方便，我们用0表示false，用1表示true。

可以看到感知器本身是一个线性分类器，它通过求考虑了权重的各输入之和与阖值的大小关系，对事物进行分类。

所以任何线性分类或线性回归问题都可以用感知器来解决。前面的布尔运算可以看作是二分类问题，即给定一个输入，输出0（属于分类0）或1（属于分类1）。
如下面所示，and运算是一个线性分类问题，即可以用一条直线把分类0（false，红叉表示）和分类1（true，绿点表示）分开。

然而，感知器却不能实现异或运算，如下图所示，异或运算不是线性的，你无法用一条直线把分类0和分类1分开。

2、感知器的训练

三、python实现感知器

class Perceptron(object):

    def __init__(self, input_num, activator):

        '''

        初始化感知器，设置输入参数的个数，以及激活函数。

        激活函数的类型为double -> double

        '''

        self.activator = activator

        # 权重向量初始化为0

        self.weights = [0.0 for _ in range(input_num)]

        # 偏置项初始化为0

        self.bias = 0.0

    def __str__(self):

        '''

        打印学习到的权重、偏置项

        '''

        return 'weights\t:%s\nbias\t:%f\n' % (self.weights, self.bias)

    def predict(self, input_vec):

        '''

        输入向量，输出感知器的计算结果

        '''

        # 把input_vec[x1,x2,x3...]和weights[w1,w2,w3,...]打包在一起

        # 变成[(x1,w1),(x2,w2),(x3,w3),...]

        # 然后利用map函数计算[x1*w1, x2*w2, x3*w3]

        # 最后利用reduce求和

        return self.activator(

            reduce(lambda a, b: a + b,

                   map(lambda (x, w): x * w,

                       zip(input_vec, self.weights))

                , 0.0) + self.bias)

    def train(self, input_vecs, labels, iteration, rate):

        '''

        输入训练数据：一组向量、与每个向量对应的label；以及训练轮数、学习率

        '''

        for i in range(iteration):

            self._one_iteration(input_vecs, labels, rate)

    def _one_iteration(self, input_vecs, labels, rate):

        '''

        一次迭代，把所有的训练数据过一遍

        '''

        # 把输入和输出打包在一起，成为样本的列表[(input_vec, label), ...]

        # 而每个训练样本是(input_vec, label)

        samples = zip(input_vecs, labels)

        # 对每个样本，按照感知器规则更新权重

        for (input_vec, label) in samples:

            # 计算感知器在当前权重下的输出

            output = self.predict(input_vec)

            # 更新权重

            self._update_weights(input_vec, output, label, rate)

    def _update_weights(self, input_vec, output, label, rate):

        '''

        按照感知器规则更新权重

        '''

        # 把input_vec[x1,x2,x3,...]和weights[w1,w2,w3,...]打包在一起

        # 变成[(x1,w1),(x2,w2),(x3,w3),...]

        # 然后利用感知器规则更新权重

        delta = label - output

        self.weights = map(

            lambda (x, w): w + rate * delta * x,

            zip(input_vec, self.weights))

        # 更新bias

        self.bias += rate * delta

def f(x):

    '''

    定义激活函数f

    '''

    return 1 if x > 0 else 0

def get_training_dataset():

    '''

    基于and真值表构建训练数据

    '''

    # 构建训练数据

    # 输入向量列表

    input_vecs = [[1,1], [0,0], [1,0], [0,1]]

    # 期望的输出列表，注意要与输入一一对应

    # [1,1] -> 1, [0,0] -> 0, [1,0] -> 0, [0,1] -> 0

    labels = [1, 0, 0, 0]

    return input_vecs, labels

def train_and_perceptron():

    '''

    使用and真值表训练感知器

    '''

    # 创建感知器，输入参数个数为2（因为and是二元函数），激活函数为f

    p = Perceptron(2, f)

    # 训练，迭代10轮, 学习速率为0.1

    input_vecs, labels = get_training_dataset()

    p.train(input_vecs, labels, 10, 0.1)

    #返回训练好的感知器

    return p

if __name__ == '__main__':

    # 训练and感知器

    and_perception = train_and_perceptron()

    # 打印训练获得的权重

    print and_perception

    # 测试

    print '1 and 1 = %d' % and_perception.predict([1, 1])

    print '0 and 0 = %d' % and_perception.predict([0, 0])

    print '1 and 0 = %d' % and_perception.predict([1, 0])

    print '0 and 1 = %d' % and_perception.predict([0, 1])

python之感知器-从零开始学深度学习的更多相关文章

从零开始学深度学习mxnet教程：安装以及基本操作
一.导言本教程适合对人工智能有一定的了解的同学,特别是对实际使⽤深度学习感兴趣的⼤学⽣.⼯程师和研究⼈员.但本教程并不要求你有任何深度学习或者机器学习的背景知识,我们将从头开始解释每⼀个概念.虽然深 ...
小白学习之pytorch框架(2)-动手学深度学习(begin-random.shuffle()、torch.index_select()、nn.Module、nn.Sequential())
在这向大家推荐一本书-花书-动手学深度学习pytorch版,原书用的深度学习框架是MXNet,这个框架经过Gluon重新再封装,使用风格非常接近pytorch,但是由于pytorch越来越火,个人又比 ...
用Python实现随机森林算法，深度学习
用Python实现随机森林算法,深度学习拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩 ...
对比《动手学深度学习》 PDF代码+《神经网络与深度学习》PDF
随着AlphaGo与李世石大战的落幕,人工智能成为话题焦点.AlphaGo背后的工作原理"深度学习"也跳入大众的视野.什么是深度学习,什么是神经网络,为何一段程序在精密的围棋大赛中 ...
【动手学深度学习】Jupyter notebook中 import mxnet出错
问题描述打开d2l-zh目录,使用jupyter notebook打开文件运行,import mxnet 出现无法导入mxnet模块的问题, 但是命令行运行是可以导入mxnet模块的. 原因: 激活 ...
Python、机器学习、计算机视觉、深度学习入门
1.简明Python教程 2.Python计算机视觉编程 3.机器学习实践 4.吴恩达机器学习 5.李飞飞深度学习与计算机视觉
python机器学习——感知器
最近在看机器学习相关的书籍,顺便把每天阅读的部分写出来和大家分享,共同学习探讨一起进步!作为机器学习的第一篇博客,我准备从感知器开始,之后会慢慢更新其他内容. 在实现感知器算法前,我们需要先了解一下神 ...
动手学深度学习14- pytorch Dropout 实现与原理
方法从零开始实现定义模型参数网络评估函数优化方法定义损失函数数据提取与训练评估 pytorch简洁实现小结针对深度学习中的过拟合问题,通常使用丢弃法(dropout),丢弃法有很多的 ...
Python实现感知器的逻辑电路（与门、与非门、或门、异或门）
在神经网络入门回顾(感知器.多层感知器)中整理了关于感知器和多层感知器的理论,这里实现关于与门.与非门.或门.异或门的代码,以便对感知器有更好的感觉. 此外,我们使用 pytest 框架进行测试. p ...

随机推荐

前端基础进阶(七)-前端工程师最容易出错的问题-this关键字
我们在学习JavaScript的时候,因为对一些概念不是很清楚,但是又会通过一些简洁的方式把它给记下来,那么这样自己记下来的概念和真正的概念产生了很强的偏差. 当然,还有一些以为这个是对的,还会把它发 ...
Programmatically mount a Microsoft Virtual Hard Drive (VHD)
By Pixy https://stackoverflow.com/questions/24396644/programmatically-mount-a-microsoft-virtual-hard ...
新版gitbook导出pdf
文章目录 gitbook自带的npm模块gitbook 使用vscode的插件Markdown PDF 使用CommandBox GitBook Exporter 最近想把自己写的一个gitbook转 ...
47000名开发者每月产生30000个漏洞微软是如何用AI排查的
目前微软共有 47000 多名开发人员,每月会产生将近 30000 个漏洞,而这些漏洞会存储在 100 多个 AzureDevOps 和 GitHub 仓库中,以便于在被黑客利用之前快速发现关键的漏洞 ...
【Linux题目】第六关
[定时任务规则] 1. 如果在某用户的crontab文件中有以下记录,该行中的命令多久执行一次(RHCE考试题)?( ) 30 4 * * 3 mycmd A. 每小时. B. 每周. C. 每年三月 ...
Spring.getBean()流程和循环依赖的解决
getBean流程介绍(以单例的Bean流程为准) getBean(beanName) 从BeanFactory中获取Bean的实例对象,真正获取的逻辑由doGetBean实现. doGetBean( ...
关于LinearLayout设置权重后width或height不设置0dp的影响说明
摘要平时没那么注意LinearLayout布局时权重的问题,设置了权重属性后,通常建议将width或height的属性值设置为0dp,有时候设置权重后,还是习惯将width或height的属性设置为 ...
mysql基础（三）存储引擎和锁
存储引擎的概念: 关系型数据库表是用于存储和组织信息的数据结构,可以将表理解为由行和列组成的表格,各种各样,不同的表结构意味着存储不同类型的数据,在数据的处理上也会存在着差异,对于mysql来说,它提 ...
一句话总结JS构造函数、原型和实例的关系
"每个构造函数都有一个原型对象, 原型对象都包含一个指向构造函数的指针, 实例都包含一个指向原型对象的内部指针." --此段话摘自<JavaScript高级程序设计>. ...
POJ3614防晒霜这个贪心有点东西（贪心+优先队列）
这个题是说有C头牛去晒太阳,带了L瓶防晒霜,每瓶防晒霜都有一个SPF值(每瓶防晒霜都能解决一个最短路 ) 每头牛给出了他可以接受防晒霜的上限,和下限,每种防晒霜都给出了SPF值与数量. 从防晒霜的sp ...

python之感知器-从零开始学深度学习