UFLDL 教程学习笔记（二）

课程链接：http://ufldl.stanford.edu/tutorial/supervised/LogisticRegression/

这一节主要讲的是梯度的概念，在实验部分，比较之前的线性回归的梯度与通过定义来计算的梯度，统计二者之间的误差。

线性回归得到的是一个连续值，有时我们想得到0或者1这样的预测值，这就要用到logistic regression。因为要得到的是概率值，

之前的表示函数显然已经不合适了，这时需要用到新的函数来表示：

我们的目标就是对theta做优化，当x属于1时，概率值为1的概率越大越好，反之越小越好。

目标函数当然也得用新的啦（关于这个函数，可参考台大的机器学习基石：http://beader.me/mlnotebook/section3/logistic-regression.html）：

作业部分就是训练识别手写0和1,需要注意的仍然是要分清各个变量的维数。跑了下训练准确率和

测试准确率都是100%

参考：http://blog.csdn.net/lingerlanlan/article/details/38390955

代码我加了点注释：

第一段代码改自ex1a_linreg.m，主要就是为了得到训练数据和测试数据，以及它们的标签。

%

%This exercise uses a data from the UCI repository:

% Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository

% http://archive.ics.uci.edu/ml

% Irvine, CA: University of California, School of Information and Computer Science.

%

%Data created by:

% Harrison, D. and Rubinfeld, D.L.

% ''Hedonic prices and the demand for clean air''

% J. Environ. Economics & Management, vol.5, 81-102, 1978.

%

addpath ../common

addpath ../common/minFunc_2012/minFunc

addpath ../common/minFunc_2012/minFunc/compiled

% Load housing data from file.

data = load('housing.data');

data=data'; % put examples in columns

% Include a row of 1s as an additional intercept feature.

data = [ ones(1,size(data,2)); data ];

% Shuffle examples.

data = data(:, randperm(size(data,2)));%返回data的一列数据

% Split into train and test sets取得训练数据和测试数据，并取得相应的标签

% The last row of 'data' is the median home price.

train.X = data(1:end-1,1:400);

train.y = data(end,1:400);

test.X = data(1:end-1,401:end);

test.y = data(end,401:end);

m=size(train.X,2);

n=size(train.X,1);

% Initialize the coefficient vector theta to random values.

theta = rand(n,1);%产生n行1列的在0到1之间的数字

% Run the minFunc optimizer with linear_regression.m as the objective.

%

% TODO:  Implement the linear regression objective and gradient computations

% in linear_regression.m

%

tic;

% options = struct('MaxIter', 200);

% theta = minFunc(@linear_regression, theta, options, train.X, train.y);

% fprintf('Optimization took %f seconds.\n', toc);

grad_check(@linear_regression,theta,200,train.X,train.y)

第二段代码是grad_check.m函数

function average_error = grad_check(fun, theta0, num_checks, varargin)

  delta=1e-3;

  sum_error=0;

  fprintf(' Iter       i             err');

  fprintf('           g_est               g               f\n')

  for i=1:num_checks

    T = theta0;

    j = randsample(numel(T),1);%从1~numel(T)中随机返回一个数

    T0=T; T0(j) = T0(j)-delta;

    T1=T; T1(j) = T1(j)+delta;

    [f,g] = fun(T, varargin{:});%T为目标函数，varargin为目标函数梯度

    f0 = fun(T0, varargin{:});

    f1 = fun(T1, varargin{:});

    g_est = (f1-f0) / (2*delta);

    error = abs(g(j) - g_est);

    fprintf('% 5d  % 6d % 15g % 15f % 15f % 15f\n', ...

            i,j,error,g(j),g_est,f);

    sum_error = sum_error + error;

  end

  average=sum_error/num_checks;

UFLDL 教程学习笔记（二）的更多相关文章

UFLDL 教程学习笔记（二）反向传导算法
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套 ...
UFLDL 教程学习笔记（四）主成分分析
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套 ...
UFLDL 教程学习笔记（三）自编码与稀疏性
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套 ...
UFLDL 教程学习笔记（一）神经网络
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套 ...
UFLDL 教程学习笔记（三）
教程地址:http://ufldl.stanford.edu/tutorial/supervised/SoftmaxRegression/ logstic regression是二分类的问题,如果想要 ...
UFLDL 教程学习笔记（四）
课程地址:http://ufldl.stanford.edu/tutorial/supervised/FeatureExtractionUsingConvolution/ 在之前的练习中,图片比较小, ...
UFLDL 教程学习笔记（六）主成分分析
教程:http://ufldl.stanford.edu/tutorial/supervised/MultiLayerNeuralNetworks/ 以及这篇博文,写的很清楚:http://blog. ...
UFLDL 教程学习笔记（一）
ufdl的新教程,从基础学起.第一节讲的是线性回归.主要目的是熟悉目标函数,计算梯度和优化. 按着教程写完代码后,总是编译出错,一查是mex的原因,实在不想整了. 这位博主用的是向量,比较简洁:htt ...
jfinal框架教程-学习笔记(二)
上一节介绍了jfinal框架的简单搭建,这节通过一个小例子了解jfinal的结构和特点先上图 1.建数据库(我用的是oracle数据库,其他的相对也差不多) -- Create table crea ...

随机推荐

案例：Redis在京东的使用技术模型图
http://www.100ec.cn 2013年09月27日17:30 中国电子商务研究中心我要投稿产品服务 (中国电子商务研究中心讯)Redis是一个开源的,遵守BSD许可协议的key ...
Android Studio下“Error:Could not find com.android.tools.build:gradle:2.2.1”的解决方法
ref from: Android Studio下“Error:Could not find com.android.tools.build:gradle:2.2.1”的解决方法http://blog ...
bzoj 4028 : [HEOI2015]公约数数列
之前看了好几次都没什么思路,今天下定决心把这题切了. 观察到$0-x$的gcd最多变化log次,因为它每次变化一定至少要去掉一个质因子,所以我们可以枚举gcd. 因为数据范围比较小,所以想到了分块. ...
md5sum命令行使用注意事项
Linux下md5sum命令可以直接计算标准输入的hash值,使用方式为 echo -n '123456' | md5sum 注意给echo加上-n表示在尾部不加换行命令行示例 $ echo -n ...
faster rcnn算法及源码及论文解析相关博客
1. 通过代码理解faster-RCNN中的RPN http://blog.csdn.net/happyflyy/article/details/54917514 2. faster rcnn详解 R ...
python学习(20) 网络编程
原文链接:http://www.limerence2017.com/2018/01/02/python20/ python 网络编程和基本的C语言编程一样,效率不是很高,如果为了封装通信库建议采用C/ ...
[Luogu 1073] NOIP2009 最优贸易
[Luogu 1073] NOIP2009 最优贸易分层图,跑最长路. 真不是我恋旧,是我写的 Dijkstra 求不出正确的最长路,我才铤而走险写 SPFA 的- #include <alg ...
八卦Minsky打压神经网络始末
八卦Minsky打压神经网络始末谈下Minsky造成的神经网络冰河事件:57年一个叫弗兰克的大概只有二流水平的学者搞出了感知机,理论和实践证明了对线性可分问题的有效性,引起一阵轰动,特别是非科学圈类 ...
nc使用笔记
netcat是网络工具中的瑞士军刀,它能通过TCP和UDP在网络中读写数据.通过与其他工具结合和重定向,你可以在脚本中以多种方式使用它. 现内网中有两台机器:Mac: 192.168.1.109 Ka ...
sql server 查询本年的每个月的数据
一.以一行数据的形式,显示本年的12月的数据,本示例以2017年为例,根据CreateDate字段判断,计算总和,查询语句如下: end) as '1月', end) as '2月', end) as ...

UFLDL 教程学习笔记（二）

UFLDL 教程学习笔记（二）的更多相关文章

随机推荐

热门专题