使用Logistic Regression Algorithm进行多分类数字识别的Octave仿真

所需解决的问题是，训练一个Logistic Regression系统，使之能够识别手写体数字1-10，每张图片为20px*20px的灰度图。训练样例的输入X是5000行400列的一个矩阵，每一行存储一张图片(20^2=400)，共5000个训练样例，而y则为手写体所表示的数字1-10。

利用Logistic Regression进行多分类应用，其基础是将问题本身化解为z个二分类问题，其中z为类别的个数。第一步，将向量m*1维y扩展为矩阵m*z维矩阵Y，向量n+1维向量theta扩展为矩阵z*(n+1)维矩阵Theta。其意义是将一维数据转换至二维，以0,1表示，从而使我们能够利用二分类来解决问题。如下图：

第二步，利用内置函数fmincg来求解10组问题的最佳theta值，构建10*401维theta_all矩阵：

function [all_theta] = oneVsAll(X, y, num_labels, lambda)

m = size(X, 1);

n = size(X, 2);

all_theta = zeros(num_labels, n + 1);

% Add ones to the X data matrix

X = [ones(m, 1) X];

% loop for every number, we train the theta of every number respectively.

initial_theta = zeros(n+1,1);

options = optimset('GradObj', 'on', 'MaxIter', 50);

for(i=1:num_labels)

  y_b=(y==i);

  all_theta(i,:) = fmincg (@(t)(lrCostFunction(t, X,y_b, lambda)), ...

                   initial_theta, options);

endfor

其中用到的lrCostFunction函数如下：

function [J, grad] = lrCostFunction(theta, X, y, lambda)

%LRCOSTFUNCTION Compute cost and gradient for logistic regression with

%regularization

%   J = LRCOSTFUNCTION(theta, X, y, lambda) computes the cost of using

%   theta as the parameter for regularized logistic regression and the

%   gradient of the cost w.r.t. to the parameters. 

% Initialize some useful values

m = length(y); % number of training examples

J = 0;

grad = zeros(size(theta));

tmp=ones(m,1);

h = sigmoid(X*theta);

h1=log(h);

h2=log(tmp-h);

y2=tmp-y;

J=(y'*h1+y2'*h2)/(-m);

theta(1)=0;

J+=theta'*theta*lambda/(2*m);

grad=((X'*(h-y))+lambda*theta)/m;

grad = grad(:);

end

第三步，合并该问题，构建“可能性矩阵”，然后选择可能性最大的项作为系统的输出：

function p = predictOneVsAll(all_theta, X)

m = size(X, 1);

num_labels = size(all_theta, 1);

p = zeros(size(X, 1), 1);

X = [ones(m, 1) X];

probMatrix = X*all_theta';

[pVector,p] = max(probMatrix,[],2);

end

使用Logistic Regression Algorithm进行多分类数字识别的Octave仿真的更多相关文章

Logistic Regression Algorithm解决分类问题
在线性回归算法中,我们看到,在training set中,输入矩阵X与向量y的值都是连续的.所以在二维空间中,我们可以用一条直线去模拟X与y的变化关系,寻找参数向量theta的取值.如根据房屋面积预测 ...
Logistic Regression Algorithm
逻辑回归算法LR. 简介逻辑回归是机器学习从统计学领域借鉴的另一种技术.它是二进制分类问题的首选方法(有两个类值的问题). Logistic回归就像线性回归,目标是找到权重每个输入变量的系数值. ...
数字锁相环Octave仿真
clc; clear all; % 仿真数据长度 SimLens = 1000; % 载波信号 Fs = 2400; Ts = 1 / Fs; Fsig = 60; % 随机初相 Delta_Phas ...
分类算法之逻辑回归（Logistic Regression
分类算法之逻辑回归(Logistic Regression) 1.二分类问题现在有一家医院,想要对病人的病情进行分析,其中有一项就是关于良性\恶性肿瘤的判断,现在有一批数据集是关于肿瘤大小的,任务就 ...
[OpenCV] Samples 06: [ML] logistic regression
logistic regression,这个算法只能解决简单的线性二分类,在众多的机器学习分类算法中并不出众,但它能被改进为多分类,并换了另外一个名字softmax, 这可是深度学习中响当当的分类算法 ...
[OpenCV] Samples 06: logistic regression
logistic regression,这个算法只能解决简单的线性二分类,在众多的机器学习分类算法中并不出众,但它能被改进为多分类,并换了另外一个名字softmax, 这可是深度学习中响当当的分类算法 ...
Logistic Regression vs Decision Trees vs SVM: Part II
This is the 2nd part of the series. Read the first part here: Logistic Regression Vs Decision Trees ...
线性模型（3）：Logistic Regression
此笔记源于台湾大学林轩田老师<机器学习基石><机器学习技法> (一)Logistic Regression 原理对于分类问题,假设我们想得到的结果不是(x属于某一类)这种形式 ...
Logistic Regression 算法向量化实现及心得
Author: 相忠良(Zhong-Liang Xiang) Email: ugoood@163.com Date: Sep. 23st, 2017 根据 Andrew Ng 老师的深度学习课程课后作 ...

随机推荐

[AtCoder ARC076] F Exhausted?
霍尔定理 + 线段树? 咱学学霍尔定理... 霍尔定理和二分图完美匹配有关,具体而言,就是定义了二分图存在完美匹配的充要条件: 不妨设当前二分图左端集合为 X ,右端集合为 Y ,X 与 Y 之间的边 ...
《A chorus section detection method for musical audio signals and its application to a music listening section》
Abstract: 重复的副歌识别对音乐理解的计算模型(computational model)至关重要,应用层面有:音乐副歌识别预览,音乐检索等. 传统检测的难点:变调,起始点和结束点(both e ...
Neo4j : 通过节点的 id属性对节点进行查，改，删操作
1. "查"操作 , 查找 id 属性为 501的节点: MATCH (r) WHERE id(r) = 501 RETURN r 2. "改"操作, 更改 ...
EPROCESS ETHREAD PEB重要成员
-----------------------------------------------------------------------win7 x86中-------------------- ...
Java缓存Ehcache-Ehcache的Cache在SSM框架中的配置
需要在Spring配置文件中配置:  <bean id="cacheManager" class="org.spri ...
在navcat中清空数据后，设置id归零方法
写后台完成后,需要清空Mysql数据库中的测试数据,但是后面新增的数据,一直是以原来所删除数据的最大id为增量基本,比如,对于一些id敏感的项,十分不便,如图原有10条数据,清空后,新增一两条,手动 ...
1142. Maximal Clique (25)
A clique is a subset of vertices of an undirected graph such that every two distinct vertices in the ...
sublime下载emmet
Emmet是一款Web前端开发工具Sublime非常有用的插件,使用仿CSS选择器的语法来生成代码,大大提高了HTML和CSS代码编写的速度.只需按住Tab键即可把一个简写展开成HTML和CSS的代码 ...
Synchronized锁升级
Synchronized锁升级锁的4中状态:无锁状态.偏向锁状态.轻量级锁状态.重量级锁状态(级别从低到高) 为什么要引入偏向锁? 因为经过HotSpot的作者大量的研究发现,大多数时候是不存在锁竞 ...
Java第二阶段之常用类
包装类缓存-128到127之间的数字(系统初始的时候就创建了,当我们调用ValueOf时,首先检查是否在范围内,在则直接取用)integer in1 ＝ integer.valueOf(-128):i ...

使用Logistic Regression Algorithm进行多分类数字识别的Octave仿真

使用Logistic Regression Algorithm进行多分类数字识别的Octave仿真的更多相关文章

随机推荐

热门专题