【笔记】机器学习 - 李宏毅 - 2

Regression 回归

应用领域包括：Stock Market Forecast, Self-driving car, Recommondation,...

Step 1: Model

对于宝可梦的CP值预测问题，假设为一个最简单的线性模型

y = b + \(\sum w_i x_i\)

\(x_i\): an attribute of input x(feature)

\(w_i\): weight, b: bias

Step 2: Goodness of Function

定义一个Loss Function来评价Function的好坏，

（input: a function, output: how bad it is, L(f) = L(w, b) ）

若采用方差来评估，则 L(w, b) = \(\sum_{n=1}^{10}(\hat{y}^n-(b+{w·x_{cp}}^n))^{2}\)

（其中，\(\hat{y}\): 表示正确的，实际观测到的结果）

Step 3: Pick the Best Function

最好的函数就是使L(f)最小的函数，f* = arg \(min_f\)L(f)

w*, b* = arg \(min_{w,b}\)L(w, b) = arg \(min_{w, b}\)\(\sum_{n=1}^{10}(\hat{y}^n-(b+{w·x_{cp}}^n))^{2}\)

如何计算呢？用的就是梯度下降法，Gradient Descent,

如果只考虑 w 一个变量：

同时考虑 w, b 两个变量：

因为线性回归的损失函数总是一个凸函数，所以不用考虑局部最小，得到的就是全局最小。

对损失函数求导得到：

根据泰勒公式，考虑更多的项，得到如下的结果：（加了高次项依然是linear model，因为\(x_{cp}\)不是参数）

当收集到更多的数据后，会发现可能还有其他未考虑的因素，

可以对模型修正为，y = \(\delta(x_s)·(b + \sum w_i x_i)\)，其中 \(\delta(x_s)\) 的取值是二元的。

可以看到拟合的效果更好了，但是如果考虑的因素过多，则可能也会出现 Overfitting 的问题。

最后，还需要对损失函数做正则化操作，以使其在测试数据上表现更好。

调参数 \(\lambda\)，\(\lambda\) 越大，曲线越平滑，对noise不那么敏感。

但是 \(\lambda\) 本质上是惩罚项，惩罚项太大，会使得参数空间变小，最后的结果也不会很好。

Demo程序：

import numpy as np

import matplotlib.pyplot as plt

from tqdm import tqdm_notebook

y_data, x_data -> \(\hat{y}\) 和 \(x_{cp}\) 值向量

x_data = [338.,333.,328.,207.,226.,25.,170.,60.,208.,606.]

y_data = [640.,633.,619.,393.,428.,27.,193.,66.,226.,1591.]

# ydata = b + w * xdata

x, y -> bias, weight

x = np.arange(-200, -100, 1)

y = np.arange(-5, 5, 0.1)

X, Y = np.meshgrid(x, y)

z -> L(w, b)

z = np.zeros((len(x), len(y)))

for i in range(len(x)):

    for j in range(len(y)):

        b = x[i]

        w = y[j]

        z[j][i] = 0

        for n in range(len(x_data)):

            z[j][i] = z[j][i] + (y_data[n] - b - w*x_data[n])**2

        z[j][i] = z[j][i] / len(x_data)

b = -120 # initial b

w = -4   # initial w

lr = 1 # learning rate

iteration = 1000000

# store initial value for plotting

b_history = [b]

w_history = [w]

lr_b = 0

lr_w = 0

# iteration

for i in tqdm_notebook(range(iteration)):

    b_grad = 0.0

    w_grad = 0.0

    for n in range(len(x_data)):

        b_grad = b_grad - 2.0*(y_data[n] - b - w*x_data[n])*1.0

        w_grad = w_grad - 2.0*(y_data[n] - b - w*x_data[n])*x_data[n]

    # AdaGrad

    lr_b = lr_b + b_grad ** 2

    lr_w = lr_w + w_grad ** 2

    # update parameters

    b = b - lr/np.sqrt(lr_b) * b_grad

    w = w - lr/np.sqrt(lr_w) * w_grad

    # b = b - lr*b_grad

    # w = w - lr*w_grad

    # store parameters for plotting

    b_history.append(b)

    w_history.append(w)

# plot the figure

plt.contourf(x, y, z, 50, alpha=0.5, cmap=plt.get_cmap('jet'))

plt.plot([-188.4], [2.67], 'x', ms=12, markeredgewidth=3, color='orange')

plt.plot(b_history, w_history, 'o-', ms=3, lw=1.5, color='black')

plt.xlim(-200, -100)

plt.ylim(-5, 5)

plt.xlabel(r'$b$', fontsize=16)

plt.ylabel(r'$w$', fontsize=16)

plt.show()

【笔记】机器学习 - 李宏毅 - 2 - Regression + Demo的更多相关文章

【笔记】机器学习 - 李宏毅 - 9 - Keras Demo
3.1 configuration 3.2 寻找最优网络参数代码示例: # 1.Step 1 model = Sequential() model.add(Dense(input_dim=28*28 ...
李宏毅老师机器学习课程笔记_ML Lecture 1: ML Lecture 1: Regression - Demo
引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...
【笔记】机器学习 - 李宏毅 - 6 - Logistic Regression
Logistic Regression 逻辑回归逻辑回归与线性回归有很多相似的地方.后面会做对比,先将逻辑回归函数可视化一下. 与其所对应的损失函数如下,并将求max转换为min,并转换为求指数形式 ...
机器学习笔记P1(李宏毅2019)
该博客将介绍机器学习课程by李宏毅的前两个章节:概述和回归. 视屏链接1-Introduction 视屏链接2-Regression 该课程将要介绍的内容如下所示: 从最左上角开始看: Regress ...
[笔记]机器学习(Machine Learning) - 01.线性回归(Linear Regression)
线性回归属于回归问题.对于回归问题,解决流程为: 给定数据集中每个样本及其正确答案,选择一个模型函数h(hypothesis,假设),并为h找到适应数据的(未必是全局)最优解,即找出最优解下的h的参数 ...
【笔记】机器学习 - 李宏毅 - 11 - Keras Demo2 & Fizz Buzz
1. Keras Demo2 前节的Keras Demo代码: import numpy as np from keras.models import Sequential from keras.la ...
【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN
神经网络的表现在Training Set上表现不好 ----> 可能陷入局部最优在Testing Set上表现不好 -----> Overfitting 过拟合虽然在机器学习中,很容 ...
【笔记】机器学习 - 李宏毅 - 5 - Classification
Classification: Probabilistic Generative Model 分类:概率生成模型如果说对于分类问题用回归的方法硬解,也就是说,将其连续化.比如 \(Class 1\) ...
【笔记】机器学习 - 李宏毅 - 1 - Introduction & next step
Machine Learning == Looking for a Function AI过程的解释:用户输入信息,计算机经过处理,输出反馈信息(输入输出信息的形式可以是文字.语音.图像等). 因为从 ...

随机推荐

RestTemplate工具类根据服务名发送请求
要使用RestTemplate 根据服务名发送请求的话需要使用 @LoadBalanced 这个注解,用了这个注解的RestTemplate就不用使用 ip 来请求了,首先要创建一个配置类 i ...
String、StringBuffer和StringBuilder总结
String String类是不可变(final)的,对String类的任何改变,都是返回一个新的String类对象. StringBuffer 当对字符串进行修改的时候,需要使用 StringBuf ...
Go语言实现：【剑指offer】删除链表中重复的结点
该题目来源于牛客网<剑指offer>专题. 给定一个排序链表,删除所有含有重复数字的节点,只保留原始链表中没有重复出现的数字. 示例 1: 输入: 1->2->3->3- ...
LNK2019
原因:inline函数被外部文件的函数调用时,必须将inline函数定义在头文件中,不能定义在cpp文件中.
【TensorFlow】TensorFlow基础 —— 模型的保存读取与可视化方法总结
TensorFlow提供了一个用于保存模型的工具以及一个可视化方案这里使用的TensorFlow为1.3.0版本一.保存模型数据模型数据以文件的形式保存到本地: 使用神经网络模型进行大数据量和复 ...
Redis Cluster 集群扩容与收缩
http://blog.csdn.net/men_wen/article/details/72896682 Redis 学习笔记(十五)Redis Cluster 集群扩容与收缩标签: redis集 ...
Java8尽管很香，你想过升级到Java11吗？会踩那些坑？
目前最新JDK 11,Oracle会一直维护到2026年. Java11的新特性 1.更新支持到Unicode 10编码 Unicode 10(version 10.0 of the Unicode ...
FTP服务器配置http访问（配置nginx+ftp服务器）
一.搭建nginx服务器先安装nginx服务器 # yum install nginx -y 启动nginx服务 # systemctl start nginx 浏览器访问:http://192.1 ...
js循环小练习
function fn(){ //打印三角形 for(var i = 1 ; i <= 30 ; i++){ for(var x = 1; x <= i; x++ ){ document. ...
iptables详解（8）iptables自定义链
自定义链存在的意义:对链进行分类 target可能是一个“动作“也可能是一个”自定义链” 1.新增自定义链. root@ubuntu:~# iptables -t filter -N IN_WEB#结 ...

【笔记】机器学习 - 李宏毅 - 2 - Regression + Demo

【笔记】机器学习 - 李宏毅 - 2 - Regression + Demo的更多相关文章

随机推荐

热门专题