sklearn使用——梯度下降及逻辑回归

一：梯度下降：

梯度下降本质上是对极小值的无限逼近。先求得梯度，再取其反方向，以定步长在此方向上走一步，下次计算则从此点开始，一步步接近极小值。需要注意的是步长的取值，如果过小，则需要多次迭代，耗费大量时间才能取得极小值;如果过大，则可能难以取得较为接近极小值的点，在极小值两边来回跳跃，无法接近极小值。

而步长的取值往往于梯度有关，如果梯度的值较大，则步长可以取大的值，如果梯度较小，则步长应取较小值。

优势：高效，优化途径多

劣势：需要一些超参数：regularization（正则化）参数以及number of iterations（迭代次数），对feature scalling（特征缩放）敏感。

 from sklearn.linear_model import SGDClassifier as SGD

 x=[[0,0],[1,1]]

 y=[0,1]

 clf = SGD(alpha=0.0001, average=False, class_weight=None, epsilon=0.1,

        eta0=0.0, fit_intercept=True, l1_ratio=0.15,

        learning_rate='optimal', loss='hinge', max_iter=5, n_iter=None,

        n_jobs=1, penalty='l2', power_t=0.5, random_state=None,

        shuffle=True, tol=None, verbose=0, warm_start=False)

 clf.fit(x,y)

 print(clf.predict([[2,2]]))

 print(clf.coef_)

 print(clf.intercept_)

 print(clf.decision_function([[2,2]])

根据官方网站的代码，使用了SGDClassifier分类器，进行了尝试。

 # coding = UTF-8

 from sklearn.linear_model import SGDClassifier as SGD

 from sklearn.datasets.samples_generator import make_blobs

 import matplotlib.pyplot as plt

 import numpy as np

 X,y = make_blobs(n_samples=50,centers=2,random_state=0,cluster_std=0.6)

 clf = SGD(loss='hinge',alpha=0.01,max_iter=200,fit_intercept=True)

 clf.fit(X,y)

 print("预测1：",clf.predict([[1,10]]))

 print("预测2：",clf.predict([[2,2]]))

 print("回归系数：",clf.coef_)

 print("偏差",clf.intercept_)

 print("##################")

 print(X.shape）

 print(y.shape)

使用make_blobs创建数据测试。

注：

loss="hinge": (soft-margin) linear Support Vector Machine （（软-间隔）线性支持向量机），

loss="modified_huber": smoothed hinge loss （平滑的 hinge 损失），

loss="log": logistic regression （logistic 回归），

and all regression losses below（以及所有的回归损失）。

前两个 loss functions（损失函数）是懒惰的，如果一个例子违反了 margin constraint（边界约束），它们仅更新模型的参数, 这使得训练非常有效率,即使使用了 L2 penalty（惩罚）我们仍然可能得到稀疏的模型结果。

梯度下降需注意参数：

alpha：乘以正则化项的常数，默认0.0001。当被设置为‘optimal’时也被用于计算学习效率

fit_intercept：是否该截取截距，默认True。如果为‘False’则假定数据以及居中。

梯度下降常用方法：

fit(X,y,coef_init=None,intercept_init=None,sample_weight=None)：拟合线性模型（训练）

X：{类似数组的稀疏矩阵}，形式：(n_sanmples,n_features)。

y：类似数组，形式：(n_samples)。

sample_weight：数组样本，形式：(n_samples,),optional（可选），可以设定个别样本的权重，如果不设定，则默认相等。

predict(X):用于预测X样本中的标签（结果/分类）

X:{类似数组的稀疏矩阵}，形式：[n_samples,n_features]。

score(X,y,samples_weight=None):：（与上方相同）用于返回测试数据和标签（结果）的平均精度。

二：逻辑回归（逻辑斯特增长模型）：

逻辑回归实际为一种分类的线性模型。如图，值域为0~1。如果需要解决非线性问题，与支持向量机SVM的思路相同，即将特征映射到高维来解决问题。因此，也可用梯度下降来求解。

 import numpy as np

 import pandas as pd

 from sklearn.linear_model import LogisticRegression as Log

 data=[ [-0.017612,14.053064,0],

        [-1.395634,4.662541,1],

        [-0.752157,6.538620,0],

        [-1.322371,7.152853,0],

        [0.423363,11.054677,0],

        [0.406704,7.067335,1],

        [0.667394,12.741452,0],

        [-2.460150,6.866805,1],

        [0.569411,9.548755,0],

        [-0.026632,10.427743,0],

        [0.850433,6.920334,1],

        [1.347183,13.175500,0],

        [1.176813,3.167020,1],

        [-1.781871,9.097953,0],

        [-0.566606,5.749003,1],

        [0.931635,1.589505,1],

        [-0.024205,6.151823,1],

        [-0.036453,2.690988,1],

        [-0.196949,0.444165,1],

        [1.014459,5.754399,1] ]

 dataMat = np.mat(data)

 y=dataMat[:,2]

 b=np.ones(y.shape)

 x=np.column_stack((b,dataMat[:,0:2]))

 x=np.mat(x)

 model = Log()

 model.fit(x,y)

 print(model)

 predicted = model.predict(x)

 answer = model.predict_proba(x)

 print (predicted)

 print(answer)

LogisticRegression中有这些参数需要注意：

penalty：'l1','l2'使用l1正则化，还是l2，默认l2

tol：精度为多少时可以停止计算，默认1e-4（十的负四次方）

C：C越大，正则化因子所占比例越小，C越小，正则化因子所占比例越大，默认1.0

solver：使用什么方法，默认liblinear（线性算法）。newton-cg，lbfgs，liblinear（对小数据集表现较好，大数据集建议使用sag及saga），sag（随即平均梯度下降算法Stochastic Average Gradient desqent solver），saga。

max_iter：最大迭代次数，默认100。

LogisticRegression常用方法：

fit(X,y,sample_weight=None)：用于拟合模型（训练）

X：{类似数组的稀疏矩阵}，形式：(n_samples,n_features)。

y：类似数组，形式：(n_samples)。

sample_weight：数组样本，形式：(n_samples,),optional（可选），可以设定个别样本的权重，如果不设定，则默认相等。

predict(X)：用于预测X样本的标签（结果/分类）

X：同上。

返回C：数组，形式：[n_samples]

predict_proba(X)：用于预测为对应标签的概率

X：同上。

返回一个n行k列的数组，n对应样本数量，k为可能的标签（结果/分类），每一行的结果之和应为1

sklearn使用——梯度下降及逻辑回归的更多相关文章

机器学习算法整理（二）梯度下降求解逻辑回归 python实现
逻辑回归(Logistic regression) 以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 用梯度下降求解逻辑回归 Logi ...
[Python]数据挖掘（1）、梯度下降求解逻辑回归——考核成绩分类
ps:本博客内容根据唐宇迪的的机器学习经典算法学习视频复制总结而来 http://www.abcplus.com.cn/course/83/tasks 逻辑回归问题描述:我们将建立一个逻辑回归模 ...
02-12 Logistic(逻辑)回归
目录逻辑回归一.逻辑回归学习目标二.逻辑回归引入三.逻辑回归详解 3.1 线性回归与逻辑回归 3.2 二元逻辑回归的假设函数 3.2.1 让步比 3.2.2 Sigmoid函数图像 3.3 二 ...
Andrew Ng机器学习课程笔记（二）之逻辑回归
Andrew Ng机器学习课程笔记(二)之逻辑回归版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7364636.html 前言 ...
机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
逻辑回归（logic regression）的分类梯度下降
首先明白一个概念,什么是逻辑回归:所谓回归就是拟合,说明x是连续的:逻辑呢?就是True和False,也就是二分类:逻辑回归即使就是指对于二分类数据的拟合(划分). 那么什么是模型呢?模型其实就是函数 ...
[Deep Learning] 神经网络编程基础 (Basics of Neural Network Programming) - 逻辑回归-梯度下降-计算图
在神经网络中,假如有m个训练集,我们想把他们加入训练,第一个想到得就是用一个for循环来遍历训练集,从而开始训练.但是在神经网络中,我们换一个计算方法,这就是前向传播和反向传播. 对于逻辑回归,就是 ...
Sklearn实现逻辑回归
方法与参数 LogisticRegression类的各项参数的含义 class sklearn.linear_model.LogisticRegression(penalty='l2', dual=F ...
sklearn逻辑回归(Logistic Regression)类库总结
class sklearn.linear_model.LogisticRegression(penalty=’l2’, dual=False, tol=0.0001, C=1.0, fit_inter ...

随机推荐

论JavaScript的作用域
一直以来本人认为想深入了解一门语言,不光是让自己变成撸sir,更需要时间的锤炼.能经得起时间考验的东西更值得拥有.学习和使用Javascript一晃都7年了,最近才感觉自己对他才有顿悟,不知道是否来得 ...
Apache生产配置
httpd.conf # # This is the main Apache HTTP server configuration file. It contains the # configurati ...
redhat 6.5安装ansible
安装epel 源: rpm -ivh https://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm 安装ansible ...
[Python Web]部署完网站需要做的基本后续工作
简述今天自己上线了一个简单的 Page,没有什么功能就是一个展示页. 但是,我发现部署完,上线后,还要弄不少东西.下面就是我记录.整理的一些上线网站基本都会用到的网站和配置. 加入统计代码这个是必 ...
PC逆向之代码还原技术,第四讲汇编中减法的代码还原
目录 PC逆向之代码还原技术,第四讲汇编中减法的代码还原一丶汇编简介二丶高级代码对应汇编观看. 1.代码还原解析: 三丶根据高级代码IDA反汇编的完整代码四丶知识总结 PC逆向之代码还原技术,第 ...
在Flutter中嵌入Native组件的正确姿势是...
引言在漫长的从Native向Flutter过渡的混合工程时期,要想平滑地过渡,在Flutter中使用Native中较为完善的控件会是一个很好的选择.本文希望向大家介绍AndroidView的使用方式 ...
【野草】SQL Server之索引解析（二）
1.堆表堆表通过IAM连接一起,查询时全表扫描. 1.1 非聚集索引结构叶子节点数据结构:行数据结构+Rid(8字节) 中间节点数据结构: (非聚集非唯一索引)行数据结构+Page(4)+2+ ...
前端异步技术之Promise
前言从事前端的朋友或多或少的接触过Promise,当代码中回调函数层级过多你就会发现Promise异步编程的魅力,相信此文一定能帮你排忧解惑! Promise概念 Promise是JS异步编程中的重 ...
Linux基础命令第一天
一.命令行bash基本操作 1,shell 用户不能直接操作内核,所以用户操作通过shell传递给内核,Linux下叫shell,就相当于Windows下的cmd shell分为两种: GUI:图形界 ...
你需要一点点CIL
1.当我们程序集中有大量反射的时候,性能往往会下降很快.我们目的很明确如何解决反射造成的这些影响,其中之一个正确且高逼格的做法是使用 CIL指令去实现.如何实现需要我们拥有若干基础知识.知道 CI ...

sklearn使用——梯度下降及逻辑回归

sklearn使用——梯度下降及逻辑回归的更多相关文章

随机推荐

热门专题