https://www.analyticsvidhya.com/blog/2015/07/difference-machine-learning-statistical-modeling/

http://normaldeviate.wordpress.com/2012/06/12/statistics-versus-machine-learning-5-2/

https://www.quora.com/What-is-the-difference-between-statistics-and-machine-learning

machine learning is an algorithm that can learn from data without relying on rules-based programming.

Statistical modelling is formalization of relationships between variables in the form of mathematical equations.

共同的目标:

learn from data,但是statistical learning的目标更多的是从手头上的数据学习后实现统计推断:得出结论

不同点从以下几个方面来阐述:

schools they come from:

machine learning是计算机科学和人工智能的一个子领域,用于构建可以从数据中学习到model,而不需要显示地编程学习rule

statistical model:是数学的一个分支,用于发现多个变量之间的关系,从而可以预测输出

diffrent eras(不同时代的产物)

statistical modelling已经存在几世纪的时间了,而machine learning实际上从1990年代才变得清晰,随着计算资源便宜化和能力巨大提高而开始成为现实

假设依赖:

统计模型往往有一些预设的假设,比如一个简单的线性回归模型会有以下假设:

1. 自变量和因变量之间是线性关系;

2. 随机变量是同方差同分布

3. 因变量的误差均值为0

4. 观测值之间是互相独立的;

5.每个因变量的值是正态分布

同样地,逻辑回归也会有其一堆预设的假设,只有当假设得到满足时,模型的效果才会比较好。而机器学习算法虽然也有部分假设,但是大大少于统计模型的假设。机器学习我们也无需指出自变量或者因变量所服从的分布

处理的数据类型:

机器学习可以处理的数据具有wide(变量的维数),deep(样本的数量巨大),而statistical model则仅适用于低维度,少样本数据集的情况,否则及其容易产生过拟合。

命名范式:

formulation:

虽然统计学模型和机器学习模型的目标是类似的,但是其最终学习的模型公式却有明显的区别:

对于统计模型,我们往往需要估计出特定样式的函数f:

Dependent Variable ( Y )  = f(Independent Variable) + error function

而,对于机器学习,则直接剔除上述f,而直接从输入到输出(可能是线性,也可能是非线性的函数)

Output(Y)  ----- >  Input (X)

预测能力:

"自然之力不会在发生一件事情之前做出任何假设。。"

因此,在一个预测model中,越少的假设条件,预测的能力会越强。机器学习正如名字所蕴含的意义其需要更少的人为参与。机器学习通过不断地迭代使得计算机自己发现隐藏在数据中的pattern.由于机器综合了所有的样本数据并且没有任何(或仅有少量)的预定假设,因此预测能力会大大强于统计模型。统计模型更多的是数学密集并且基于系数估计,它要求建模人员本身已经理解了变量之间本身存在的关系,只有这样建设的模型才会有用。

统计学家和机器学习工程师对模型输出的不同描述:

  • ML professional: “The model is 85% accurate in predicting Y, given a, b and c.”
  • Statistician: “The model is 85% accurate in predicting Y, given a, b and c; and I am 90% certain that you will obtain the same result.”

machine learning model(algorithm model) .vs. statistical model的更多相关文章

  1. How do I learn machine learning?

    https://www.quora.com/How-do-I-learn-machine-learning-1?redirected_qid=6578644   How Can I Learn X? ...

  2. Introducing: Machine Learning in R(转)

    Machine learning is a branch in computer science that studies the design of algorithms that can lear ...

  3. Machine Learning - XV. Anomaly Detection异常检測 (Week 9)

    http://blog.csdn.net/pipisorry/article/details/44783647 机器学习Machine Learning - Andrew NG courses学习笔记 ...

  4. 壁虎书1 The Machine Learning Landscape

    属性与特征: attribute: e.g., 'Mileage' feature: an attribute plus its value, e.g., 'Mileage = 15000' Note ...

  5. Intro to Machine Learning

    本节主要用于机器学习入门,介绍两个简单的分类模型: 决策树和随机森林 不涉及内部原理,仅仅介绍基础的调用方法 1. How Models Work 以简单的决策树为例 This step of cap ...

  6. Note for video Machine Learning and Data Mining——Linear Model

    Here is the note for lecture three. the linear model Linear model is a basic and important model in ...

  7. A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning

    A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning by Jason Brownlee on S ...

  8. (转)Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning

    Introduction Optimization is always the ultimate goal whether you are dealing with a real life probl ...

  9. [Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族

    声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面 记得在<Pattern Recognition And Machine ...

随机推荐

  1. Python -- 网络编程 -- 抓取网页图片 -- 豆瓣妹子

    首先分析页面URL,形如http://dbmeizi.com/category/[1-14]?p=[0-476] 图片种类对应编号: 1:'性感', 2:'有沟', 3:'美腿', 4:'小露点', ...

  2. Go语言学习笔记十一: 切片(slice)

    Go语言学习笔记十一: 切片(slice) 切片这个概念我是从python语言中学到的,当时感觉这个东西真的比较好用.不像java语言写起来就比较繁琐.不过我觉得未来java语法也会支持的. 定义切片 ...

  3. 全局描述符表(GDT)——《x86汇编语言:从实模式到保护模式》读书笔记09

    在进入保护模式之前,我们先要学习一些基础知识.今天我们看一下全局描述符表(Global Descriptor Table, 简称GDT). 同实模式一样,在保护模式下,对内存的访问仍然使用段地址加偏移 ...

  4. 使用Xshell和Xftp部署简单的项目

    最近本人偶尔接触到该如何部署项目,朋友要求截图,趁此之际,简单总结一下,以供大家分享,更希望各位大神指点,大家相互学习,有问题的勿喷. 1.使用环境:win 7 + tomcat 7 + MyEcli ...

  5. ES6那些事半功倍的新特性(一)

    数组方面 Array.from(xxx):把json格式字符串转换成数组: Array.of(x,x,x):负责把一堆文本或者变量转换成数组 find( ):该方法为实例方法,就是以Array对象开头 ...

  6. 【持续更新】一个简洁、易用的美赛LaTeX模板: easyMCM

    目录 1 当前美赛模板通行情况的概述 2 easymcm宏包说明 2.1 与mcmthesis的关系之说明 2.2 easymcm宏包的简介 2.3 美赛模板下载地址 3 常见问题的解决方案 若您无意 ...

  7. ubuntu上安装redis

    1.Redis简要介绍 访问Redis官方网站 https://redis.io/ 上面介绍到 ,redis是开源,BSD许可,高级的key-value存储系统,可以用来存储字符串,哈希结构,链表,集 ...

  8. jquery源码学习笔记(一)jQuery的无new构建

    本人是一名.net程序员..... 你一个.net coder 看什么jQuery 源码啊? 原因吗,很简单.技多不压身吗(麻蛋,前端工作好高...羡慕). 我一直都很喜欢JavaScript,废话不 ...

  9. java 对CSV 文件的读取与生成

    CSV文件是以逗号分隔值的文件格式,一般用WORDPAD或记事本(NOTE),EXCEL打开.CSV(逗号分隔值)是一种用来存储数据的纯文本文件,通常都是用于存放电子表格或数据的一种文件格式,对于CS ...

  10. 量子猴排(Quantum Bogo sort)

    排序原理 原理很简单,如果数组不是有序的,就洗一次牌,直至数组有序为止 时间复杂度 最佳情况O(n),平均情况O(n×n!) 代码如下: import java.util.Random; public ...