线性回归 python 代码实现

本代码参考自：https://github.com/lawlite19/MachineLearning_Python#%E4%B8%80%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92

首先，线性回归公式：y = X*W +b 其中X是m行n列的数据集，m代表样本的个数，n代表每个样本的数据维度。则W是n行1列的数据，b是m行1列的数据，y也是。

损失函数采用MSE，采用梯度下降法进行训练

1 .加载数据集并进行读取

def load_csvdata(filename,split,dataType):        #加载数据集

    return np.loadtxt(filename,delimiter = split,dtype = dataType)

def read_data():  #读取数据集

    data = load_csvdata("data.txt",split=",",dataType=np.float64)

    print(data.shape)

    X = data[:,0:-1] #取data的前两列

    y = data[:,-1]   #取data的最后一列作为标签

    return X,y

2 . 对数据进行标准化

def feature_normalization(X):

    X_norm = np.array(X)

    mu = np.zeros((1,X.shape[1]))

    std = np.zeros((1,X.shape[1]))

    mu = np.mean(X_norm,0)

    std = np.std(X_norm,0)

    for i in range(X.shape[1]):

        X_norm[:,i] = (X_norm[:,i] - mu[i]) / std[i]

    return X_norm,mu,std

3. 损失值的计算

def loss(X,y,w):

    m = len(y)

    J = 0

    J = (np.transpose(X*w - y))*(X*w - y) / (2*m)

    print(J)

    return J

4. 梯度下降算法的python实现

def gradientDescent(X,y,w,lr,num_iters):

    m = len(y)  #获取数据集长度

    n = len(w)  #获取每个输入数据的维度

    temp = np.matrix(np.zeros((n,num_iters)))

    J_history = np.zeros((num_iters,1))

    for i in range(num_iters): #进行迭代

        h = np.dot(X,w)   #线性回归的矢量表达式

        temp[:,i] = w - ((lr/m)*(np.dot(np.transpose(X),h-y))) #梯度的计算

        w = temp[:,i]

        J_history[i] = loss(X,y,w)

    return w,J_history

5. 绘制损失值随迭代次数变化的曲线图

def plotLoss(J_history,num_iters):

    x = np.arange(1,num_iters+1)

    plt.plot(x,J_history)

    plt.xlabel("num_iters")

    plt.ylabel("loss")

    plt.title("Loss value changes with the number of iterations")

    plt.show()

6. 主函数

if __name__ == "__main__":

    X,y = read_data()

    X,mu,sigma = feature_normalization(X)

    m = len(y)     #样本的总个数

    X = np.hstack((np.ones((m,1)),X))   #在x上加上1列是为了计算偏移b   X=[x0,x1,x2,......xm] 其中x0=1 y = x*w

    y = y.reshape((-1,1))

    lr = 0.01

    num_iters = 400

    w = np.random.normal(scale=0.01, size=((X.shape[1],1)))

    theta,J_history = gradientDescent(X,y,w,lr,num_iters)

    plotLoss(J_history,num_iters)

7.结果

线性回归 python 代码实现的更多相关文章

线性回归——Python代码实现
import numpy as np def computer_error_for_give_point(w, b, points): # 计算出观测值与计算值之间的误差, 并累加,最后返回平均 ...
梯度下降法的python代码实现（多元线性回归）
梯度下降法的python代码实现(多元线性回归最小化损失函数) 1.梯度下降法主要用来最小化损失函数,是一种比较常用的最优化方法,其具体包含了以下两种不同的方式:批量梯度下降法(沿着梯度变化最快的方向 ...
【机器学习】线性回归python实现
线性回归原理介绍线性回归python实现线性回归sklearn实现这里使用python实现线性回归,没有使用sklearn等机器学习框架,目的是帮助理解算法的原理. 写了三个例子,分别是单变量的 ...
机器学习/逻辑回归（logistic regression）/--附python代码
个人分类: 机器学习本文为吴恩达<机器学习>课程的读书笔记,并用python实现. 前一篇讲了线性回归,这一篇讲逻辑回归,有了上一篇的基础,这一篇的内容会显得比较简单. 逻辑回归(log ...
一元回归1_基础（python代码实现）
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&u ...
李宏毅机器学习课程笔记-2.5线性回归Python实战
本文为作者学习李宏毅机器学习课程时参照样例完成homework1的记录. 任务描述(Task Description) 现在有某地空气质量的观测数据,请使用线性回归拟合数据,预测PM2.5. 数据集描 ...
可爱的豆子——使用Beans思想让Python代码更易维护
title: 可爱的豆子--使用Beans思想让Python代码更易维护 toc: false comments: true date: 2016-06-19 21:43:33 tags: [Pyth ...
if __name__== "__main__" 的意思(作用)python代码复用
if __name__== "__main__" 的意思(作用)python代码复用转自:大步's Blog http://www.dabu.info/if-__-name__ ...
Python 代码风格
1 原则在开始讨论Python社区所采用的具体标准或是由其他人推荐的建议之前,考虑一些总体原则非常重要. 请记住可读性标准的目标是提升可读性.这些规则存在的目的就是为了帮助人读写代码,而不是相反. ...

随机推荐

JavaScript DOM 编程艺术
最近把JavaScript DOM 编程艺术这本书看完了,觉得这本书很好深入浅出地展示了渐进增强.平稳退化.结构和样式分离等编程思想,我对书中重要的知识进行了梳理总结. 一.网页二.JavaScr ...
使用Fedora8 iso开发环境开发gtk3跨Linux多版本桌面应用
原文: https://bbs.otherhill.com/index.php/topic/show/82 gtk3 demo在/usr/local/gtk3demo 目录下 cd /usr/loca ...
23种设计模式之模板方法（Template Pattern）
定义一个操作中的算法的骨架,而将一些步骤延迟到子类中.模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤 AbstractClass:抽象类.用来定义算法骨架和原语操作,在这个类里 ...
thymeleaf 将后端绑定数据直接传递js变量
根据自我需求,thymeleaf可以直接将后端数据传递给js中进行使用,例如: 1.后端接口数据: @Controllerpublic class TestController { @RequestM ...
java基础之读取文件方法大全
1.按字节读取文件内容2.按字符读取文件内容3.按行读取文件内容 4.随机读取文件内容 public class ReadFromFile { /** * 以字节为单位读取文件,常用于读二进制文件,如 ...
.Net Core 商城微服务项目系列（十一）：MQ消费端独立为Window服务+消息处理服务
之前使用MQ的时候是通过封装成dll发布Nuget包来使用,消息的发布和消费都耦合在使用的站点和服务里,这样会造成两个问题: 1.增加服务和站点的压力,因为每次消息的消费就意味着接口的调用,这部分的压 ...
wdcp 开启某个Mysql数据库远程访问
wdcp 开启某个Mysql数据库远程访问登录wdcp后台-Mysql管理-phpmyadmin 输入Mysql的root密码登录进入示例代码: update mysql.user set hos ...
Java 学习笔记之线程安全
线程安全: 线程安全的方法一定是排队运行的. public class SyncObject { synchronized public void methodA() { try { System.o ...
【maven的使用】2使用maven与pom文件
一.使用maven:首先需要知道的是,在我们开发人员中有一句话叫做:约定优于配置.比如,如果我们写代码有多种可选方案:硬编码形式:obj.setPath("d:/xxxx") .配 ...
Java 2019 生态圈使用报告，这结果你赞同吗？
这是国外一机构调查了 7000 名开发者得出来的 Java 2019 年生态圈工具使用报告,主要调查了 Java 版本.开发框架.web 服务器等使用情况.虽然只有 7000 名开发者参与调查,这数目 ...

线性回归 python 代码实现

线性回归 python 代码实现的更多相关文章

随机推荐

热门专题