BP神经网络及异或实现

BP神经网络是最简单的神经网络模型了，三层能够模拟非线性函数效果。

难点：

如何确定初始化参数？
如何确定隐含层节点数量？
迭代多少次？如何更快收敛？
如何获得全局最优解？

 '''

 neural networks 

 created on 2019.9.24

 author: vince

 '''

 import math

 import logging

 import numpy

 import random

 import matplotlib.pyplot as plt

 '''

 neural network

 '''

 class NeuralNetwork:

     def __init__(self, layer_nums, iter_num = 10000, batch_size = 1):

         self.__ILI = 0;

         self.__HLI = 1;

         self.__OLI = 2;

         self.__TLN = 3;

         if len(layer_nums) != self.__TLN:

             raise Exception("layer_nums length must be 3");

         self.__layer_nums = layer_nums;  #array [layer0_num, layer1_num ...layerN_num]

         self.__iter_num = iter_num;

         self.__batch_size = batch_size;

     def train(self, X, Y):

         X = numpy.array(X);

         Y = numpy.array(Y);

         self.L = [];

         #initialize parameters

         self.__weight = [];

         self.__bias = [];

         self.__step_len = [];

         for layer_index in range(1, self.__TLN):

             self.__weight.append(numpy.random.rand(self.__layer_nums[layer_index - 1], self.__layer_nums[layer_index]) * 2 - 1.0);

             self.__bias.append(numpy.random.rand(self.__layer_nums[layer_index]) * 2 - 1.0);

             self.__step_len.append(0.3);

         logging.info("bias:%s" % (self.__bias));

         logging.info("weight:%s" % (self.__weight));

         for iter_index in range(self.__iter_num):

             sample_index = random.randint(0, len(X) - 1);

             logging.debug("-----round:%s, select sample %s-----" % (iter_index, sample_index));

             output = self.forward_pass(X[sample_index]);

             g = (-output[2] + Y[sample_index]) * self.activation_drive(output[2]);

             logging.debug("g:%s" % (g));

             for j in range(len(output[1])):

                 self.__weight[1][j] += self.__step_len[1] * g * output[1][j];

             self.__bias[1] -= self.__step_len[1] * g;

             e = [];

             for i in range(self.__layer_nums[self.__HLI]):

                 e.append(numpy.dot(g, self.__weight[1][i]) * self.activation_drive(output[1][i]));

             e = numpy.array(e);

             logging.debug("e:%s" % (e));

             for j in range(len(output[0])):

                 self.__weight[0][j] += self.__step_len[0]  * e * output[0][j];

             self.__bias[0] -= self.__step_len[0] * e;

             l = 0;

             for i in range(len(X)):

                 predictions = self.forward_pass(X[i])[2];

                 l += 0.5 * numpy.sum((predictions - Y[i]) ** 2);

             l /= len(X);

             self.L.append(l);

             logging.debug("bias:%s" % (self.__bias));

             logging.debug("weight:%s" % (self.__weight));

             logging.debug("loss:%s" % (l));

         logging.info("bias:%s" % (self.__bias));

         logging.info("weight:%s" % (self.__weight));

         logging.info("L:%s" % (self.L));

     def activation(self, z):

         return (1.0 / (1.0 + numpy.exp(-z)));

     def activation_drive(self, y):

         return y * (1.0 - y);

     def forward_pass(self, x):

         data = numpy.copy(x);

         result = [];

         result.append(data);

         for layer_index in range(self.__TLN - 1):

             data = self.activation(numpy.dot(data, self.__weight[layer_index]) - self.__bias[layer_index]);

             result.append(data);

         return numpy.array(result);

     def predict(self, x):

         return self.forward_pass(x)[self.__OLI];

 def main():

     logging.basicConfig(level = logging.INFO,

             format = '%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',

             datefmt = '%a, %d %b %Y %H:%M:%S');

     logging.info("trainning begin.");

     nn = NeuralNetwork([2, 2, 1]);

     X = numpy.array([[0, 0], [1, 0], [1, 1], [0, 1]]);

     Y = numpy.array([0, 1, 0, 1]);

     nn.train(X, Y);

     logging.info("trainning end. predict begin.");

     for x in X:

         print(x, nn.predict(x));

     plt.plot(nn.L)

     plt.show();

 if __name__ == "__main__":

     main();

具体收敛效果

BP神经网络及异或实现的更多相关文章

BP神经网络求解异或问题(Python实现)
反向传播算法(Back Propagation)分二步进行,即正向传播和反向传播.这两个过程简述如下: 1．正向传播输入的样本从输入层经过隐单元一层一层进行处理,传向输出层:在逐层处理的过程中.在输 ...
BP神经网络原理及python实现
[废话外传]:终于要讲神经网络了,这个让我踏进机器学习大门,让我读研,改变我人生命运的四个字!话说那么一天,我在乱点百度,看到了这样的内容: 看到这么高大上,这么牛逼的定义,怎么能不让我这个技术宅男心 ...
BP神经网络分类器的设计
1.BP神经网络训练过程论述 BP网络结构有3层:输入层.隐含层.输出层,如图1所示. 图1 三层BP网络结构 3层BP神经网络学习训练过程主要由4部分组成:输入模式顺传播(输入模式由输入层经隐含层向 ...
【转】漫谈ANN(2)：BP神经网络
上一次我们讲了M-P模型,它实际上就是对单个神经元的一种建模,还不足以模拟人脑神经系统的功能.由这些人工神经元构建出来的网络,才能够具有学习.联想.记忆和模式识别的能力.BP网络就是一种简单的人工神经 ...
神经网络中的BP神经网络和贝叶斯
1 贝叶斯网络在地学中的应用 1 1.1基本原理及发展过程 1 1.2 具体的研究与应用 4 2 BP神经网络在地学中的应用 6 2.1BP神经网络简介 6 2.2基本原理 7 2.3 在地学中的具体 ...
BP神经网络与Python实现
人工神经网络是一种经典的机器学习模型,随着深度学习的发展神经网络模型日益完善. 联想大家熟悉的回归问题, 神经网络模型实际上是根据训练样本创造出一个多维输入多维输出的函数, 并使用该函数进行预测, 网 ...
机器学习入门学习笔记：（一）BP神经网络原理推导及程序实现
机器学习中,神经网络算法可以说是当下使用的最广泛的算法.神经网络的结构模仿自生物神经网络,生物神经网络中的每个神经元与其他神经元相连,当它“兴奋”时,想下一级相连的神经元发送化学物质,改变这些神经元的 ...
三层BP神经网络的python实现
这是一个非常漂亮的三层反向传播神经网络的python实现,下一步我准备试着将其修改为多层BP神经网络. 下面是运行演示函数的截图,你会发现预测的结果很惊人! 提示:运行演示函数的时候,可以尝试改变隐藏 ...
二、单层感知器和BP神经网络算法
一.单层感知器 1958年[仅仅60年前]美国心理学家FrankRosenblant剔除一种具有单层计算单元的神经网络,称为Perceptron,即感知器.感知器研究中首次提出了自组织.自学习的思想, ...

随机推荐

使用 custom element 创建自定义元素
很早我们就可以在 HTML 文档中写 <custome-element></custom-element> 这样的自定义名称标签.但是浏览器对于不认识的标签一律当成一个普通的行 ...
JZOJ 1776. 经济编码 (Standard IO)
1776. 经济编码 (Standard IO) Time Limits: 1000 ms Memory Limits: 128000 KB Description 为降低资料储存的空间或增加资料传送 ...
leetcode 219
固定长度的滑动窗口+set class Solution { public: bool containsNearbyDuplicate(vector<int>& nums, int ...
第二章、 Vue 起步
2-2.编写hello world 首先创建vue实例,然后实例接收一些配置项,el表示实例负责管理的区域,data表示区域内的数据两秒后内容变为bye world 其中app表示实例对象,$dat ...
elasticjob学习二：封装elasticjob-spring-boot-starter
之前已经简单的学习了es-job.但是如果实际应用都如同第一篇进行编写,会有很多重复代码,不方便.这篇主要是进行封装.我还会用一个demo使用下封装好的组件. elasticjob-spring-bo ...
RTP SIP win服务端软件 VOIP
RTP Real-time Transport Protocol 实时传输入协议,使用 udp 做为载体. SIP Session Initiation Protocol 会话初始化协议,加入,查询, ...
rabitmq + php
消费者 <?php //配置信息 $conn_args = array( 'host' => '127.0.0.1', 'port' => '5672', 'login' => ...
JVM笔记-运行时内存区域划分
1. 概述 Java 虚拟机在执行 Java 程序的过程中会把它管理的内存划分为若干个不同的数据区域.它们各有用途,有些随着虚拟机进程的启动一直存在(堆.方法区),有些则随着用户线程的启动和结束而建立 ...
js 实现字符串的查找和替换
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
（转）协议森林03 IP接力赛 (IP, ARP, RIP和BGP协议)
协议森林03 IP接力赛 (IP, ARP, RIP和BGP协议) 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 网络层(net ...

BP神经网络及异或实现

BP神经网络及异或实现的更多相关文章

随机推荐

热门专题