【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值

本题目来自吴恩达机器学习视频。

题目：

你是一个餐厅的老板，你想在其他城市开分店，所以你得到了一些数据（数据在本文最下方），数据中包括不同的城市人口数和该城市带来的利润。第一列是城市的人口数，第二列是在这个城市开店所带来的利润数。

现在，假设一开始θ0和θ1都是0，利用梯度下降的方法，找到合适的θ值，其中学习速率α=0.01，迭代轮次为1000轮

上一个文章里，我们得出了CostFunction，即损失函数。

现在我们需要找到令损失函数最小的θ值，利用梯度下降函数

1、导包

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

2、之前写的CostFunction函数

def computeCost(X, y, theta):

    inner = np.power(((X * theta.T) - y), 2)

    return np.sum(inner) / (2 * len(X))

3、引入文件，把X和Y分开，在X左边加一列1，θ0和θ1设置为0，0

path = 'ex1data1.txt'

data = pd.read_csv(path, header=None, names=['Population', 'Profit'])

data.insert(0, 'Ones', 1)
rows = data.shape[0]
cols = data.shape[1]
X = data.iloc[:, 0:cols - 1]
Y = data.iloc[:, cols - 1:cols]
theta = np.mat('0,0')
X = np.mat(X.values)
Y = np.mat(Y.values)

cost = computeCost(X, Y, theta)

4、设置更新速率α为0.01，设置迭代次数为1000次

alpha = 0.01

iters = 1500

5、写出梯度下降函数的实现

def gradientDescent(X, Y, theta, alpha, iters):

    temp = np.mat(np.zeros(theta.shape))  # 一个数组，temp大小为θ的个数

    parameters = int(theta.ravel().shape[1])  # 参数的个数

    cost = np.zeros(iters)  # 一个数组，存着每次计算出来的costFunction的值

    for i in range(iters):

        error = (X*theta.T)-Y;  #误差值

        for j in range(parameters):

            term = np.multiply(error,X[:, j])

            temp[0,j] = theta[0,j] - ((alpha/len(X)) * np.sum(term))

        theta = temp

        cost[i] = computeCost(X,Y,theta)

    return theta, cost

解析：

temp数组存的是临时变量，因为所有的θ需要同步更新，所以先存入临时变量中，后面计算完所有θ的值后再同步更新。

parameters是一个int值的数，即有多少个变量，本题中有θ0和θ1，所以parameters=2

cost是一个数组，大小和迭代次数一样，每一层存放当前迭代次数下的CostFunction的返回值

6、调用函数，并返回结果

g, cost = gradientDescent(X, Y, theta, alpha, iters)

print(g)

最后结果g=[[-3.24140214 1.1272942 ]]

即最后的θ0=-3.24 θ1=1.127

7、把图打出来，看看是否收敛

fig, ax = plt.subplots(figsize=(12,8))

ax.plot(np.arange(iters),cost,'r')

ax.set_xlabel('Iterations')

ax.set_ylabel('Cost')

plt.show()

发现随着迭代次数iters的增大，损失慢慢的降低，所以有效，计算正确。

PS：数据集在机器学习的第一篇中的最下方。

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值的更多相关文章

【Python】机器学习之单变量线性回归利用正规方程找到合适的参数值
[Python]机器学习之单变量线性回归利用正规方程找到合适的参数值本次作业来自吴恩达机器学习. 你是一个餐厅的老板,你想在其他城市开分店,所以你得到了一些数据(数据在本文最下方),数据中包括不同 ...
机器学习 (一) 单变量线性回归 Linear Regression with One Variable
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔 ...
吴恩达机器学习(二) 单变量线性回归(Linear Regression with one variable)
一.模型表示 1.一些术语如下图,房价预测.训练集给出了房屋面积和价格,下面介绍一些术语: x:输入变量或输入特征(input variable/features). y:输出变量或目标变量(out ...
机器学习之单变量线性回归（Linear Regression with One Variable）
1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我们通过一个例子来开始.这个例子用来预测住房价格,我们使用一个数据集,该数据集包含俄勒冈州波特兰市的住 ...
【Python】机器学习之单变量线性回归练习（计算Cost Function）
注:练习来自于吴恩达机器学习翻译后的题目: 你是一个餐厅的老板,你想在其他城市开分店,所以你得到了一些数据(数据在本文最下方),数据中包括不同的城市人口数和该城市带来的利润.第一列是城市的人口数,第 ...
python 单变量线性回归
单变量线性回归(Linear Regression with One Variable)¶ In [54]: #初始化工作 import random import numpy as np imp ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 2_Linear regression with one variable 单变量线性回归
Lecture2 Linear regression with one variable 单变量线性回归 2.1 模型表示 Model Representation 2.1.1 线性回归 Li ...
机器学习第2课：单变量线性回归(Linear Regression with One Variable)
2.1 模型表示之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示: 我们将要用来描述这个回归问题的标记如下: m 代表训练集中实 ...
机器学习（二）--------单变量线性回归(Linear Regression with One Variable)
面积与房价训练集 (Training Set) Size Price 2104 460 852 178 ...... m代表训练集中实例的数量x代表输入变量 ...

随机推荐

MySQL安装到最后一步未响应MySQL Server Instance Configuration Wizard
MySQL安装到最后一步未响应第一个方法: 打开C盘,并且显示隐藏文件,然后在C盘下就能找到一个文件夹叫 "ProgamData" ,打开它,删除里面的 "mys ...
Java集合--Map架构
概要前面,我们已经系统的对List进行了学习.接下来,我们先学习Map,然后再学习Set:因为Set的实现类都是基于Map来实现的(如,HashSet是通过HashMap实现的,TreeSet是通过 ...
Mongo Restore
#!/bin/sh HOST_IP=`/sbin/ifconfig | sed -n 's/.*inet addr:\([0-9.]\+\)\s.*/\1/p' | head -n1` echo &q ...
web上传下载文件
WebService代码: /// /// 上传文件 /// /// 文件的byte[] /// 上传文件的路径 /// 上传文件名字 /// ...
idea maven配置
转载自:https://www.cnblogs.com/Silencepeng/p/7444012.html 一.下载maven的包 http://www.apache.org/ 1.在网页中打开上面 ...
在stm32开发可以调用c标准库的排序和查找 qsort bsearch
在嵌入式开发中,可以使用c标准库自带的库函数,而不用自己去早轮子,qsort 和bsearch就是其中的两个比较好用的二分法查找,前提是已经排序好的数据.下面的代码, 如果数据为排序,则要进行排序后 ...
POJ 2893 M × N Puzzle——八数码有解条件
题意:给定M*N的数码图,问能否移动到最终状态分析有解的判定条件可见八数码有解条件值得一提的是,这道题求逆序对卡树状数组,只能用归并排序. #include<cstdio> #in ...
[2019HDU多校第四场][HDU 6617][D. Enveloping Convex]
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6617 题目大意:给出一凸包\(P\),求最小的与\(P\)相似且对应边平行的多边形,使得题目给出的\( ...
一个项目中：只能存在一个 WebMvcConfigurationSupport （添加swagger坑）
问题再现: 1.添加了swagger配置,导致接口响应的中文乱码 2.于是又添加了配置解决中文乱码的配置: 问题来了,添加了CharsetConfig 配置后swagger的配置失效了,访问404,搞 ...
vue中插槽（slot）的使用
刚学vue的时候,曾经学习过slot插槽的使用,但是后面接触的不多,因为之前我还没使用element-ui... 但是使用了element-ui之后,里面的许多组件,有时候会使用插槽,为了巩固一下插槽 ...

【Python】机器学习之单变量线性回归 利用批量梯度下降找到合适的参数值

【Python】机器学习之单变量线性回归 利用批量梯度下降找到合适的参数值的更多相关文章

随机推荐

热门专题

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值的更多相关文章