用java写bp神经网络（一）

根据前篇博文《神经网络之后向传播算法》，现在用java实现一个bp神经网络。矩阵运算采用jblas库，然后逐渐增加功能，支持并行计算，然后支持输入向量调整，最后支持L-BFGS学习算法。

上帝说，要有神经网络，于是，便有了一个神经网络。上帝还说，神经网络要有节点，权重，激活函数，输出函数，目标函数，然后也许还要有一个准确率函数，于是，神经网络完成了：

public class Net {

	List<DoubleMatrix> weights = new ArrayList<DoubleMatrix>();

	List<DoubleMatrix> bs = new ArrayList<>();

	List<ScalarDifferentiableFunction> activations = new ArrayList<>();

	CostFunctionFactory costFunc;

	CostFunctionFactory accuracyFunc;

	int[] nodesNum;

	int layersNum;

	public Net(int[] nodesNum, ScalarDifferentiableFunction[] activations,CostFunctionFactory costFunc) {

		super();

		this.initNet(nodesNum, activations);

		this.costFunc=costFunc;

		this.layersNum=nodesNum.length-1;

	}

	public Net(int[] nodesNum, ScalarDifferentiableFunction[] activations,CostFunctionFactory costFunc,CostFunctionFactory accuracyFunc) {

		this(nodesNum,activations,costFunc);

		this.accuracyFunc=accuracyFunc;

	}

	public void resetNet() {

		this.initNet(nodesNum, (ScalarDifferentiableFunction[]) activations.toArray());

	}

	private void initNet(int[] nodesNum, ScalarDifferentiableFunction[] activations) {

		assert (nodesNum != null && activations != null

				&& nodesNum.length == activations.length + 1 && nodesNum.length > 1);

		this.nodesNum = nodesNum;

		this.weights.clear();

		this.bs.clear();

		this.activations.clear();

		for (int i = 0; i < nodesNum.length - 1; i++) {

			// 列数==输入；行数==输出。

			int columns = nodesNum[i];

			int rows = nodesNum[i + 1];

			double r1 = Math.sqrt(6) / Math.sqrt(rows + columns + 1);

			//r1=0.001;

			// W

			DoubleMatrix weight = DoubleMatrix.rand(rows, columns).muli(2*r1).subi(r1);

			//weight=DoubleMatrix.ones(rows, columns);

			weights.add(weight);

			// b

			DoubleMatrix b = DoubleMatrix.zeros(rows, 1);

			bs.add(b);

			// activations

			this.activations.add(activations[i]);

		}

	}

}

上帝造完了神经网络，去休息了。人说，我要使用神经网络，我要利用正向传播计算各层的结果，然后利用反向传播调整网络的状态，最后，我要让它能告诉我猎物在什么方向，花儿为什么这样香。

public class Propagation {

	Net net;

	public Propagation(Net net) {

		super();

		this.net = net;

	}

	// 多个样本。

	public ForwardResult forward(DoubleMatrix input) {

		ForwardResult result = new ForwardResult();

		result.input = input;

		DoubleMatrix currentResult = input;

		int index = -1;

		for (DoubleMatrix weight : net.weights) {

			index++;

			DoubleMatrix b = net.bs.get(index);

			final ScalarDifferentiableFunction activation = net.activations

					.get(index);

			currentResult = weight.mmul(currentResult).addColumnVector(b);

			result.netResult.add(currentResult);

			// 乘以导数

			DoubleMatrix derivative = MatrixUtil.applyNewElements(

					new ScalarFunction() {

						@Override

						public double valueAt(double x) {

							return activation.derivativeAt(x);

						}

					}, currentResult);

			currentResult = MatrixUtil.applyNewElements(activation,

					currentResult);

			result.finalResult.add(currentResult);

			result.derivativeResult.add(derivative);

		}

		result.netResult=null;// 不再需要。

		return result;

	}

    // 多个样本梯度平均值。

	public BackwardResult backward(DoubleMatrix target,

			ForwardResult forwardResult) {

		BackwardResult result = new BackwardResult();

		DoubleMatrix cost = DoubleMatrix.zeros(1,target.columns);

		DoubleMatrix output = forwardResult.finalResult

				.get(forwardResult.finalResult.size() - 1);

		DoubleMatrix outputDelta = DoubleMatrix.zeros(output.rows,

				output.columns);

		DoubleMatrix outputDerivative = forwardResult.derivativeResult

				.get(forwardResult.derivativeResult.size() - 1);

		DoubleMatrix accuracy = null;

		if (net.accuracyFunc != null) {

			accuracy = DoubleMatrix.zeros(1,target.columns);

		}

		for (int i = 0; i < target.columns; i++) {

			CostFunction costFunc = net.costFunc.create(target.getColumn(i)

					.toArray());

			cost.put(i, costFunc.valueAt(output.getColumn(i).toArray()));

			// System.out.println(i);

			DoubleMatrix column1 = new DoubleMatrix(

					costFunc.derivativeAt(output.getColumn(i).toArray()));

			DoubleMatrix column2 = outputDerivative.getColumn(i);

			outputDelta.putColumn(i, column1.muli(column2));

			if (net.accuracyFunc != null) {

				CostFunction accuracyFunc = net.accuracyFunc.create(target

						.getColumn(i).toArray());

				accuracy.put(i,

						accuracyFunc.valueAt(output.getColumn(i).toArray()));

			}

		}

		result.deltas.add(outputDelta);

		result.cost = cost;

		result.accuracy = accuracy;

		for (int i = net.layersNum - 1; i >= 0; i--) {

			DoubleMatrix pdelta = result.deltas.get(result.deltas.size() - 1);

			// 梯度计算，取所有样本平均

			DoubleMatrix layerInput = i == 0 ? forwardResult.input

					: forwardResult.finalResult.get(i - 1);

			DoubleMatrix gradient = pdelta.mmul(layerInput.transpose()).div(

					target.columns);

			result.gradients.add(gradient);

			// 偏置梯度

			result.biasGradients.add(pdelta.rowMeans());

			// 计算前一层delta，若i=0，delta为输入层误差，即input调整梯度，不作平均处理。

			DoubleMatrix delta = net.weights.get(i).transpose().mmul(pdelta);

			if (i > 0)

				delta = delta.muli(forwardResult.derivativeResult.get(i - 1));

			result.deltas.add(delta);

		}

		Collections.reverse(result.gradients);

		Collections.reverse(result.biasGradients);

		//其它的delta都不需要。

		DoubleMatrix inputDeltas=result.deltas.get(result.deltas.size()-1);

		result.deltas.clear();

		result.deltas.add(inputDeltas);

		return result;

	}

	public Net getNet() {

		return net;

	}

}

上面是一次正向/反向传播的具体代码。训练方式为批量训练，即所有样本一起训练。然而我们可以传入只有一列的input/target样本实现adapt方式的串行训练，也可以把样本分成很多批传入实现mini-batch方式的训练，这，不是Propagation要考虑的事情，它只是忠实的把传入的数据正向过一遍，反向过一遍，然后把过后的数据原封不动的返回给你。至于传入什么，以及结果怎么运用，是Trainer和Learner要做的事情。下回分解。

用java写bp神经网络（一）的更多相关文章

用java写bp神经网络（四）
接上篇. 在(一)和(二)中,程序的体系是Net,Propagation,Trainer,Learner,DataProvider.这篇重构这个体系. Net 首先是Net,在上篇重新定义了激活函数和 ...
用java写bp神经网络（三）
孔子曰,吾日三省吾身.我们如果跟程序打交道,除了一日三省吾身外,还要三日一省吾代码.看代码是否可以更简洁,更易懂,更容易扩展,更通用,算法是否可以再优化,结构是否可以再往上抽象.代码在不断的重构过程中 ...
用java写bp神经网络（二）
接上篇. Net和Propagation具备后,我们就可以训练了.训练师要做的事情就是,怎么把一大批样本分成小批训练,然后把小批的结果合并成完整的结果(批量/增量):什么时候调用学习师根据训练的结果进 ...
python手写bp神经网络实现人脸性别识别1.0
写在前面:本实验用到的图片均来自google图片,侵删! 实验介绍用python手写一个简单bp神经网络,实现人脸的性别识别.由于本人的机器配置比较差,所以无法使用网上很红的人脸大数据数据集(如lf ...
JAVA实现BP神经网络算法
工作中需要预测一个过程的时间,就想到了使用BP神经网络来进行预测. 简介 BP神经网络(Back Propagation Neural Network)是一种基于BP算法的人工神经网络,其使用BP算法 ...
java写卷积神经网络---CupCnn简介
https://blog.csdn.net/u011913612/article/details/79253450
BP神经网络的手写数字识别
BP神经网络的手写数字识别 ANN 人工神经网络算法在实践中往往给人难以琢磨的印象,有句老话叫“出来混总是要还的”,大概是由于具有很强的非线性模拟和处理能力,因此作为代价上帝让它“黑盒”化了.作为一种 ...
【机器学习】BP神经网络实现手写数字识别
最近用python写了一个实现手写数字识别的BP神经网络,BP的推导到处都是,但是一动手才知道,会理论推导跟实现它是两回事.关于BP神经网络的实现网上有一些代码,可惜或多或少都有各种问题,在下手写了一 ...
BP神经网络的直观推导与Java实现
人工神经网络模拟人体对于外界刺激的反应.某种刺激经过人体多层神经细胞传递后,可以触发人脑中特定的区域做出反应.人体神经网络的作用就是把某种刺激与大脑中的特定区域关联起来了,这样我们对于不同的刺激就可以 ...

随机推荐

ZABBIX作集中式NGINX性能监控的注意要点
今天测试好了.但有几个要点要注意. 一是出了问题看日志. 二是主动测试脚本. 三是注意LLD自动发现的ZABBIX类型(TRAPPER,捕捉器类型) 四是有主机上有问题时可以看到(UNSUPPORT) ...
Com进程通信（有详细步骤）
http://www.cnblogs.com/FKdelphi/p/5772950.html
Tomcat error: A child container failed during start
Tomcat error: A child container failed during start java.lang.NoClassDefFoundError: org/quartz/Sched ...
【REST API】
微信公众平台开发者文档 RESTful API 设计最佳实践登录判断写去接口里 PUT 新建一个资源POST 更新一个资源GET 查看一个资源DELETE 删除一个资源
【转】Java 枚举7常见种用法
原文网址:http://softbeta.iteye.com/blog/1185573 Java 枚举7常见种用法博客分类: java java枚举enmu 原创地址:http://blog.li ...
Eclipse的快捷键及常用设置
本篇文章转自:http://blog.csdn.net/idsunb/article/details/6604451 1.提示键配置一般默认情况下,Eclipse ,MyEclipse 的代码提示功能 ...
phantomjs截图的实践
年前也做了一些东西,由于过年只顾疯了,也没有整理,年后补上把~ 今天整理一下个phantomjs截图实践中遇到的问题. 最近做的一个项目,需要在首页展示已经做的一些项目的缩 ...
js输入框只能输入数字和小数点
<input name="number" onKeyPress="if (event.keyCode!=46 && (event.keyCode&l ...
AS3 Graphics 多次绘制
AS3中 Sprite和Shape类都持有一个Graphics对象,利用Graphics对象可以方便的利用内置的绘图方法绘制一些简单的图形. 之前在游戏中做新手引导的时候利用显示对象的BlendMod ...
IOS多线程的小总结
ios中多线程的实现方案有4种 1.pthread :一套通用的多线程API/适用于Unix\Linux\Windows等系统 (跨平台可移植/使用难度大) C语言几乎不用 ...

用java写bp神经网络（一）

用java写bp神经网络（一）的更多相关文章

随机推荐

热门专题