逻辑回归二分类

今天尝试写了一下逻辑回归分类，把代码分享给大家，至于原理的的话请戳这里 https://blog.csdn.net/laobai1015/article/details/78113214 （在这片博客的基础上我加了一丢丢东西）。

用到的预测函数为

其中，h为预测函数（大于0.5为一类，小于等于0.5为另一类）。θ为各个特征的参数。θ=[θ1,θ2,θ3...]^T

损失函数J(θ)为

利用梯度下降算法进行参数的更新公式如下：

其中，α是学习率参数，λ是正则项参数，需要自己输入。

用上述三个公式即可写出一般情况下的逻辑回归分类，经试验，其分类效果在我的测试数据下有90%以上准确度。

以下代码为了演示方面，只提供了两个特征值，然后加了一个常数项（经过实验，常数项是不可缺少的）。大家在使用自己的数据集的话只需要进行一点小改动即可。

matlab代码如下：

clear

clc

%% 数据准备

%X = xlsread('C:\Users\user01\Desktop\test.xlsx');

%二分类 随机生成数据。  200个数据  每个数据2个特征

data=1*rand(300,2);

label=zeros(300,1);

%label(sqrt(data(:,1).^2+data(:,2).^2)<8)=1;

label((data(:,2)+data(:,1)>1))=1;

%在data上加常数特征项；

data=[data,ones(size(data,1),1)];

%打乱循序

randIndex = randperm(size(data,1));

data_new=data(randIndex,:);

label_new=label(randIndex,:);

%80%训练  20%测试

k=0.8*size(data,1);

X1=data_new(1:k,:);

Y1=label_new(1:k,:);

X2=data_new(k+1:end,:);

Y2=label_new(k+1:end,:);

[m1,n1] = size(X1);

[m2,n2] = size(X2);

Features=size(data,2); %特征个数

 %% 开始训练

%设定学习率为0.01

delta=1;

lamda=0.2; %正则项系数

theta1=rand(1,Features);

%theta1=[.5,.5];

%%训练模型

%梯度下降算法求解theta（每次都是对全部的数据进行训练）

num = 300; %最大迭代次数

L=[];

while(num)

    dt=zeros(1,Features);

    loss=0;

    for i=1:m1

        xx=X1(i,1:Features);

        yy=Y1(i,1);

        h=1/(1+exp(-(theta1 * xx')));

        dt=dt+(h-yy) * xx;

        loss=loss+ yy*log(h)+(1-yy)*log(1-h);

    end

    loss=-loss/m1;

    L=[L,loss];

    theta2=theta1 - delta*dt/m1 - lamda*theta1/m1;

    theta1=theta2;

    num = num - 1;

    if loss<0.01

        break;

    end

end

figure

subplot(1,2,1)

plot(L)

title('loss')

subplot(1,2,2)

x=0:0.1:10;

y=(-theta1(1)*x-theta1(3))/theta1(2);

plot(x,y,'linewidth',2)

hold on

plot(data(label==1,1),data(label==1,2),'ro')

hold on

plot(data(label==0,1),data(label==0,2),'go')

axis([0 1 0 1])

%测试数据

acc=0;

for i=1:m2

    xx=X2(i,1:Features)';

    yy=Y2(i);

    finil=1/(1+exp(-theta2 * xx));

    if finil>0.5 && yy==1

        acc=acc+1;

    end

    if finil<=0.5 && yy==0

        acc=acc+1;

    end

end

acc/m2

%测试结果： 测试准确率为95%。

得到的loss曲线为：

分类图像为：

matlab-逻辑回归二分类（Logistic Regression）的更多相关文章

逻辑回归模型（Logistic Regression）及Python实现
逻辑回归模型(Logistic Regression)及Python实现 http://www.cnblogs.com/sumai 1.模型在分类问题中,比如判断邮件是否为垃圾邮件,判断肿瘤是否为阳 ...
斯坦福CS229机器学习课程笔记 part2：分类和逻辑回归 Classificatiion and logistic regression
Logistic Regression 逻辑回归 1.模型逻辑回归解决的是分类问题,并且是二元分类问题(binary classification),y只有0,1两个取值.对于分类问题使用线性回归不 ...
分类和逻辑回归(Classification and logistic regression)
分类问题和线性回归问题问题很像,只是在分类问题中,我们预测的y值包含在一个小的离散数据集里.首先,认识一下二元分类(binary classification),在二元分类中,y的取值只能是0和1.例 ...
机器学习算法笔记1_2:分类和逻辑回归(Classification and Logistic regression)
形式: 採用sigmoid函数: g(z)=11+e−z 其导数为g′(z)=(1−g(z))g(z) 如果: 即: 若有m个样本,则似然函数形式是: 对数形式: 採用梯度上升法求其最大值求导: 更 ...
斯坦福机器学习视频笔记 Week3 逻辑回归与正则化 Logistic Regression and Regularization
我们将讨论逻辑回归. 逻辑回归是一种将数据分类为离散结果的方法. 例如,我们可以使用逻辑回归将电子邮件分类为垃圾邮件或非垃圾邮件. 在本模块中,我们介绍分类的概念,逻辑回归的损失函数(cost fun ...
逻辑回归原理面试 Logistic Regression
逻辑回归是假设数据服从独立且服从伯努利分布,多用于二分类场景,应用极大似然估计构造损失函数,并使用梯度下降法对参数进行估计.
吴恩达深度学习：2.9逻辑回归梯度下降法(Logistic Regression Gradient descent)
1.回顾logistic回归,下式中a是逻辑回归的输出,y是样本的真值标签值 . (1)现在写出该样本的偏导数流程图.假设这个样本只有两个特征x1和x2, 为了计算z,我们需要输入参数w1.w2和b还 ...
Tensorflow 实现稠密输入数据的逻辑回归二分类
首先实现一个尽可能少调用tf.nn模块儿的,自己手写相关的function import tensorflow as tf import numpy as np import melt_da ...
吴恩达机器学习笔记22-正则化逻辑回归模型(Regularized Logistic Regression)
针对逻辑回归问题,我们在之前的课程已经学习过两种优化算法:我们首先学习了使用梯度下降法来优化代价函数

随机推荐

c++中thread的死法
在调用thread后,不调用join()函数时, 线程的两种行为:1)自己管理join()函数 2)生成后不管理,线程完了自己杀死自己detach()函数.使用detach()时,线程比较简单,一般 ...
JS实现购物商城商品放大
img属于行内元素 <img src=''>gq</img> 效果当放大图片时候,文字位置发生改变文字出现在图片下方,因为图片有一个隐形的g线,这条线的位置和以前上学时候, ...
Ubuntu 终端使用ss代理
用polipo软件,这个软件可以吧socket5转换成http代理 $ sudo apt-get install polipo $ sudo vim /etc/polipo/config 在文件中加入 ...
mysql 生成时间序列数据 - 存储过程
由于时间自动转换为int值, 做一步转化,也可在调用时处理 use `test`; CREATE table test.test1 as SELECT state, id, `规格条码`, `色号条码 ...
saltstack实战1-salt-syndic
Syndic建立在中心Master和Minions之间, 并允许多层分级Syndic, 使Salt拓扑可以变得更为灵活. 那么Syndic是如何工作的? 当前有哪些优势和局限哪? Syndic的优势和 ...
TR069网管测试华为ITMS平台(内部测试使用)
声明:本篇华为ITMS平台仅用于学习和测试使用,如果需要商用,请购买正版软件! 原创作品,转载请注明出处,严禁非法转载或者用于商业目的! email:40879506@qq.com 一．准备软件 V ...
通用唯一识别码UUID
UUID 概念:UUID 是通用唯一识别码(Universally Unique Identifier)的缩写,目前最广泛应用的UUID,是微软公司的全局唯一标识符(GUID),而其他重要的应用,则 ...
Deviceiocontrol操作异常时，关于getlasterror的错误代码解析
[0]-操作成功完成. [1]-功能错误. [2]-系统找不到指定的文件. [3]-系统找不到指定的路径. [4]-系统无法打开文件. [5]-拒绝访问. [6]-句柄无效. [7]-存储控制块被损坏 ...
HttpClient 上传图片
Image image = Image.FromFile(@"F:\image2\DSC02028.JPG"); var data = ImageToByteArray(image ...
RN 的页面布局
从 https://blog.csdn.net/liangzelei/article/details/53965417转载 React Native布局详细指南 https://www.jiansh ...

matlab-逻辑回归二分类（Logistic Regression）

逻辑回归二分类

matlab-逻辑回归二分类（Logistic Regression）的更多相关文章

随机推荐

热门专题