前文再续书接上一回,机器学习的主要目的,是根据特征进行预测.预测到的信息,叫标签. 从特征映射出标签的诸多算法中,有一个简单的算法,叫简单线性回归.本文介绍简单线性回归的概念. (1)什么是简单线性回归 "回归(regression)"是什么?如之前所讲,预测模型可区分为"分类器"跟"回归器",回归器,就是用来预测趋势变化的,比如预测明天哪支股会涨停,预测某天的降雨量是多少,预测未来一年房价的变化,等等.所以回归就是预测的意思,没有什么高深的.线…
记录下学习使用sklearn,将使用sklearn实现机器学习大部分内容 基于scikit-learn机器学习(第2版)这本书,和scikit-learn中文社区 简单线性回归 首先,最简单的线性回归也有几个地方要注意 fit的时候,对于X,要求是n*m的类型,y要是n*1的类型 sklearn会将得到的系数存储起来,分别在coef_中和intercept_中,intercept_是偏移,也就是b,coef_是k,或者向量中的W 来看具体例子 from sklearn.linear_model…
# -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt ## 设置字符集,防止中文乱码 import matplotlib matplotlib.rcParams['font.sans-serif']=[u'simHei'] matplotlib.rcParams['axes.unicode_minus']=False # X为披萨的直径 X = np.array([[6],[8],[10],[14],…
一.MSE.RMSE.MAE 思路:测试数据集中的点,距离模型的平均距离越小,该模型越精确 # 注:使用平均距离,而不是所有测试样本的距离和,因为距离和受样本数量的影响 1)公式: MSE:均方误差 RMSE:均方根误差 MAE:平均绝对误差 二.具体实现 1)自己的代码 import numpy as np from sklearn.metrics import r2_score class SimpleLinearRegression: def __init__(self): ""…
一.机器学习基本概念 1.训练集和测试集 训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集 测试集(testing set/data)/测试样例 (testing examples):用来专门进行测试已经学习好的模型或者算法的数据集 2.特征向量 特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例 3.分类问题和回归问题 分类 (classific…
机器学习之五 正则化的线性回归-岭回归与Lasso回归 注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基本原理有一个透彻.直观的理解.直到最近再次接触到这个概念,经过一番苦思冥想后终于有了我自己的理解. 0. 正则化(Regularization ) 前面使用多项式回归,如果多项式最高次项比较大,模型就容易出现过拟合.正则化是一种常见的防止过拟合的方法,一般原理是在代价函数后面加上一个对参数的约束项,…
文章简介 使用python简单实现机器学习中单元线性回归算法. 算法目的 该算法核心目的是为了求出假设函数h中多个theta的值,使得代入数据集合中的每个x,求得的h(x)与每个数据集合中的y的差值的和最小.简单来说就是需要生成一个函数,它尽可能贴近实际数据中的每个值,方便我们预测. 核心算法 假设函数 即需要求的函数,为了简单在此只设置一个x对应一个y,求theta0和theta1 代价函数 目的是J最小,也就是每个y到达函数的距离之和最小. 批量梯度下降函数 带假设函数和代价函数带入到下降函…
写在开头 由于某些原因开始了机器学习,为了更好的理解和深入的思考(记录)所以开始写博客. 学习教程来源于github的Avik-Jain的100-Days-Of-MLCode 英文版:https://github.com/Avik-Jain/100-Days-Of-ML-Code 中文翻译版:https://github.com/MLEveryday/100-Days-Of-ML-Code 本人新手一枚,所以学习的时候遇到不懂的会经常百度,查看别人的博客现有的资料.但是由于不同的人思维和写作风格…
一.引入相关库 %matplotlib inline import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties font=FontProperties(fname=r'c:/windows/fonts/msyh.ttf',size=10) 二.一元回归范例 def runplt(): plt.figure() plt.title(u'披萨价格与直径数据',fontproperties=fo…
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 机器学习,项目统计联系QQ:231469242  目录 1.基本概念 2.SSE/SSR/SST可视化 3.简单回归分为两类 4.一元回归公式 5.估计的…