from numpy import array, append, vstack, transpose, reshape, \
dot, true_divide, mean, exp, sqrt, log, \
loadtxt, savetxt, zeros, frombuffer
from numpy.linalg import norm, lstsq
from multiprocessing import Process, Array
from random import sample
from time import time
from sys import stdout
from ctypes import c_double
from h5py import File def metrics(a, b):
return norm(a - b) def gaussian (x, mu, sigma):
return exp(- metrics(mu, x)**2 / (2 * sigma**2)) def multiQuadric (x, mu, sigma):
return pow(metrics(mu,x)**2 + sigma**2, 0.5) def invMultiQuadric (x, mu, sigma):
return pow(metrics(mu,x)**2 + sigma**2, -0.5) def plateSpine (x,mu):
r = metrics(mu,x)
return (r**2) * log(r) class Rbf:
def __init__(self, prefix = 'rbf', workers = 4, extra_neurons = 0, from_files = None):
self.prefix = prefix
self.workers = workers
self.extra_neurons = extra_neurons # Import partial model
if from_files is not None:
w_handle = self.w_handle = File(from_files['w'], 'r')
mu_handle = self.mu_handle = File(from_files['mu'], 'r')
sigma_handle = self.sigma_handle = File(from_files['sigma'], 'r') self.w = w_handle['w']
self.mu = mu_handle['mu']
self.sigmas = sigma_handle['sigmas'] self.neurons = self.sigmas.shape[0] def _calculate_error(self, y):
self.error = mean(abs(self.os - y))
self.relative_error = true_divide(self.error, mean(y)) def _generate_mu(self, x):
n = self.n
extra_neurons = self.extra_neurons # TODO: Make reusable
mu_clusters = loadtxt('clusters100.txt', delimiter='\t') mu_indices = sample(range(n), extra_neurons)
mu_new = x[mu_indices, :]
mu = vstack((mu_clusters, mu_new)) return mu def _calculate_sigmas(self):
neurons = self.neurons
mu = self.mu sigmas = zeros((neurons, ))
for i in xrange(neurons):
dists = [0 for _ in xrange(neurons)]
for j in xrange(neurons):
if i != j:
dists[j] = metrics(mu[i], mu[j])
sigmas[i] = mean(dists)* 2
# max(dists) / sqrt(neurons * 2))
return sigmas def _calculate_phi(self, x):
C = self.workers
neurons = self.neurons
mu = self.mu
sigmas = self.sigmas
phi = self.phi = None
n = self.n def heavy_lifting(c, phi):
s = jobs[c][1] - jobs[c][0]
for k, i in enumerate(xrange(jobs[c][0], jobs[c][1])):
for j in xrange(neurons):
# phi[i, j] = metrics(x[i,:], mu[j])**3)
# phi[i, j] = plateSpine(x[i,:], mu[j]))
# phi[i, j] = invMultiQuadric(x[i,:], mu[j], sigmas[j]))
phi[i, j] = multiQuadric(x[i,:], mu[j], sigmas[j])
# phi[i, j] = gaussian(x[i,:], mu[j], sigmas[j]))
if k % 1000 == 0:
percent = true_divide(k, s)*100
print(c, ': {:2.2f}%'.format(percent))
print(c, ': Done') # distributing the work between 4 workers
shared_array = Array(c_double, n * neurons)
phi = frombuffer(shared_array.get_obj())
phi = phi.reshape((n, neurons)) jobs = []
workers = [] p = n / C
m = n % C
for c in range(C):
jobs.append((c*p, (c+1)*p + (m if c == C-1 else 0)))
worker = Process(target = heavy_lifting, args = (c, phi))
workers.append(worker)
worker.start() for worker in workers:
worker.join() return phi def _do_algebra(self, y):
phi = self.phi w = lstsq(phi, y)[0]
os = dot(w, transpose(phi))
return w, os
# Saving to HDF5
os_h5 = os_handle.create_dataset('os', data = os) def train(self, x, y):
self.n = x.shape[0] ## Initialize HDF5 caches
prefix = self.prefix
postfix = str(self.n) + '-' + str(self.extra_neurons) + '.hdf5'
name_template = prefix + '-{}-' + postfix
phi_handle = self.phi_handle = File(name_template.format('phi'), 'w')
os_handle = self.w_handle = File(name_template.format('os'), 'w')
w_handle = self.w_handle = File(name_template.format('w'), 'w')
mu_handle = self.mu_handle = File(name_template.format('mu'), 'w')
sigma_handle = self.sigma_handle = File(name_template.format('sigma'), 'w') ## Mu generation
mu = self.mu = self._generate_mu(x)
self.neurons = mu.shape[0]
print('({} neurons)'.format(self.neurons))
# Save to HDF5
mu_h5 = mu_handle.create_dataset('mu', data = mu) ## Sigma calculation
print('Calculating Sigma...')
sigmas = self.sigmas = self._calculate_sigmas()
# Save to HDF5
sigmas_h5 = sigma_handle.create_dataset('sigmas', data = sigmas)
print('Done') ## Phi calculation
print('Calculating Phi...')
phi = self.phi = self._calculate_phi(x)
print('Done')
# Saving to HDF5
print('Serializing...')
phi_h5 = phi_handle.create_dataset('phi', data = phi)
del phi
self.phi = phi_h5
print('Done') ## Algebra
print('Doing final algebra...')
w, os = self.w, _ = self._do_algebra(y)
# Saving to HDF5
w_h5 = w_handle.create_dataset('w', data = w)
os_h5 = os_handle.create_dataset('os', data = os) ## Calculate error
self._calculate_error(y)
print('Done') def predict(self, test_data):
mu = self.mu = self.mu.value
sigmas = self.sigmas = self.sigmas.value
w = self.w = self.w.value print('Calculating phi for test data...')
phi = self._calculate_phi(test_data)
os = dot(w, transpose(phi))
savetxt('iok3834.txt', os, delimiter='\n')
return os @property
def summary(self):
return '\n'.join( \
['-----------------',
'Training set size: {}'.format(self.n),
'Hidden layer size: {}'.format(self.neurons),
'-----------------',
'Absolute error : {:02.2f}'.format(self.error),
'Relative error : {:02.2f}%'.format(self.relative_error * 100)]) def predict(test_data):
mu = File('rbf-mu-212243-2400.hdf5', 'r')['mu'].value
sigmas = File('rbf-sigma-212243-2400.hdf5', 'r')['sigmas'].value
w = File('rbf-w-212243-2400.hdf5', 'r')['w'].value n = test_data.shape[0]
neur = mu.shape[0] mu = transpose(mu)
mu.reshape((n, neur)) phi = zeros((n, neur))
for i in range(n):
for j in range(neur):
phi[i, j] = multiQuadric(test_data[i,:], mu[j], sigmas[j]) os = dot(w, transpose(phi))
savetxt('iok3834.txt', os, delimiter='\n')
return os

径向基(RBF)神经网络python实现的更多相关文章

  1. RBF(径向基)神经网络

    只要模型是一层一层的,并使用AD/BP算法,就能称作 BP神经网络.RBF 神经网络是其中一个特例.本文主要包括以下内容: 什么是径向基函数 RBF神经网络 RBF神经网络的学习问题 RBF神经网络与 ...

  2. RBF高斯径向基核函数【转】

    XVec表示X向量.||XVec||表示向量长度.r表示两点距离.r^2表示r的平方.k(XVec,YVec) = exp(-1/(2*sigma^2)*(r^2))= exp(-gamma*r^2) ...

  3. 机器学习之径向基神经网络(RBF NN)

    本文基于台大机器学习技法系列课程进行的笔记总结. 主要内容如下图所示: 首先介绍一下径向基函数网络的Hypothesis和网络的结构,然后介绍径向基神经网络学习算法,以及利用K-means进行的学习, ...

  4. RBF径向基神经网络——乳腺癌医学诊断建模

    案例描述 近年来疾病早期诊断越来越受到医学专家的重视,从而产生了各种疾病诊断的新方法.乳癌最早的表现是患乳出现单发的.无痛性并呈进行性生长的小肿块.肿块位于外上象限最多见,其次是乳头.乳晕区和内上象限 ...

  5. 径向基网络(RBF network)

    来源:http://blog.csdn.net/zouxy09/article/details/13297881 1.径向基函数 径向基函数(Radical Basis Function,RBF)方法 ...

  6. RBF神经网络

    RBF神经网络 RBF神经网络通常只有三层,即输入层.中间层和输出层.其中中间层主要计算输入x和样本矢量c(记忆样本)之间的欧式距离的Radial Basis Function (RBF)的值,输出层 ...

  7. RBF神经网络——直接看公式,本质上就是非线性变换后的线性变化(RBF神经网络的思想是将低维空间非线性不可分问题转换成高维空间线性可分问题)

    Deeplearning Algorithms tutorial 谷歌的人工智能位于全球前列,在图像识别.语音识别.无人驾驶等技术上都已经落地.而百度实质意义上扛起了国内的人工智能的大旗,覆盖无人驾驶 ...

  8. RBF神经网络学习算法及与多层感知器的比较

    对于RBF神经网络的原理已经在我的博文<机器学习之径向基神经网络(RBF NN)>中介绍过,这里不再重复.今天要介绍的是常用的RBF神经网络学习算法及RBF神经网络与多层感知器网络的对比. ...

  9. RBF神经网络通用函数 newrb, newrbe

      RBF神经网络通用函数 newrb, newrbe 1.newrb 其中P为输入向量,T为输出向量,GOAL为均方误差的目标,SPREED为径向基的扩展速度.返回值是一个构建好的网络,用newrb ...

  10. RBF神经网络的matlab简单实现

    径向基神经网络 1.径向基函数 (Radial Basis Function,RBF) 神经网络是一种性能良好的前向网络,具有最佳逼近.训练简洁.学习收敛速度快以及克服局部最小值问题的性能,目前已经证 ...

随机推荐

  1. Linux wget命令详解

    wget是一个下载文件的工具,它用在命令行下.对于Linux用户是必不可少的工具,我们经常要下载一些软件或从远程服务器恢复备份到本地服务器. wget支持HTTP,HTTPS和FTP协议,可以使用HT ...

  2. lumen框架的辅助函数

    简介 Laravel 包含一些多样化的 PHP 辅助函数函数.许多在 Laravel 自身框架中使用:如果你觉得实用,也可以在你应用当中使用. 可用方法 数组 array_add array_coll ...

  3. SharePoint 2007——内容管理之归档篇

    如果需要使用这个功能普通的站点上(没有使用Record Center站点模板的站点),必须激活'Office SharePoint Server Publishing’  featue. 在使用Rec ...

  4. ZT 类模板Stack的实现 by vector

    *//*第3章 类模板 与函数相似,类也可以被一种或多种类型参数化.容器类就是一个具有这种特性的典型例子,它通常被用于管理某种特定类型的元素.只要使用类模板,你就可以实现容器类,而不需要确定容器中元素 ...

  5. Qimage QBuffer

    QImage image;QByteArray ba;QBuffer buffer(&ba);buffer.open(QIODevice::WriteOnly);image.save(& ...

  6. JWinner:一个私人定制的快速开发框架,为理想而生

    关于JWinner JWinner是一个JAVA项目的快速开发框架,他已经实现了大多数项目开发之前需要进行的一些必备工作,还有很多在开发过程中可能会用到的工具集. JWinner的诞生并不是一蹴而就的 ...

  7. 20165302 ch02 课下作业

    20165302 ch02 课下作业 作业内容 补充完成课上测试(不能只有截图,要有分析,问题解决过程,新学到的知识点) 完成教材 p97 2.96 2.97,要有完备的测试 发一篇相关内容的博客, ...

  8. Docker实战(九)之数据库应用

    目前,主流数据库包括关系型和非关系型两种. 关系型数据库是建立在关系模型基础上的数据库,借助于集合代数等数学概念金额方法来处理数据库中的数据,支持复杂的事务处理和结构化查询.代表实现有MySQL .O ...

  9. Spring源码分析(二十五)finishRefresh

    摘要: 本文结合<Spring源码深度解析>来分析Spring 5.0.6版本的源代码.若有描述错误之处,欢迎指正. 在 Spring 中还提供了 Lifecycle 接口, Lifecy ...

  10. P2758 编辑距离

    题目描述 设A和B是两个字符串.我们要用最少的字符操作次数,将字符串A转换为字符串B.这里所说的字符操作共有三种: 1.删除一个字符: 2.插入一个字符: 3.将一个字符改为另一个字符: !皆为小写字 ...