machine learning model(algorithm model) .vs. statistical model
https://www.analyticsvidhya.com/blog/2015/07/difference-machine-learning-statistical-modeling/
http://normaldeviate.wordpress.com/2012/06/12/statistics-versus-machine-learning-5-2/
https://www.quora.com/What-is-the-difference-between-statistics-and-machine-learning
machine learning is an algorithm that can learn from data without relying on rules-based programming.
Statistical modelling is formalization of relationships between variables in the form of mathematical equations.
共同的目标:
learn from data,但是statistical learning的目标更多的是从手头上的数据学习后实现统计推断:得出结论
不同点从以下几个方面来阐述:
schools they come from:
machine learning是计算机科学和人工智能的一个子领域,用于构建可以从数据中学习到model,而不需要显示地编程学习rule
statistical model:是数学的一个分支,用于发现多个变量之间的关系,从而可以预测输出
diffrent eras(不同时代的产物)
statistical modelling已经存在几世纪的时间了,而machine learning实际上从1990年代才变得清晰,随着计算资源便宜化和能力巨大提高而开始成为现实
假设依赖:
统计模型往往有一些预设的假设,比如一个简单的线性回归模型会有以下假设:
1. 自变量和因变量之间是线性关系;
2. 随机变量是同方差同分布
3. 因变量的误差均值为0
4. 观测值之间是互相独立的;
5.每个因变量的值是正态分布
同样地,逻辑回归也会有其一堆预设的假设,只有当假设得到满足时,模型的效果才会比较好。而机器学习算法虽然也有部分假设,但是大大少于统计模型的假设。机器学习我们也无需指出自变量或者因变量所服从的分布
处理的数据类型:
机器学习可以处理的数据具有wide(变量的维数),deep(样本的数量巨大),而statistical model则仅适用于低维度,少样本数据集的情况,否则及其容易产生过拟合。
命名范式:

formulation:
虽然统计学模型和机器学习模型的目标是类似的,但是其最终学习的模型公式却有明显的区别:
对于统计模型,我们往往需要估计出特定样式的函数f:
Dependent Variable ( Y ) = f(Independent Variable) + error function
而,对于机器学习,则直接剔除上述f,而直接从输入到输出(可能是线性,也可能是非线性的函数)
Output(Y) ----- > Input (X)
预测能力:
"自然之力不会在发生一件事情之前做出任何假设。。"
因此,在一个预测model中,越少的假设条件,预测的能力会越强。机器学习正如名字所蕴含的意义其需要更少的人为参与。机器学习通过不断地迭代使得计算机自己发现隐藏在数据中的pattern.由于机器综合了所有的样本数据并且没有任何(或仅有少量)的预定假设,因此预测能力会大大强于统计模型。统计模型更多的是数学密集并且基于系数估计,它要求建模人员本身已经理解了变量之间本身存在的关系,只有这样建设的模型才会有用。
统计学家和机器学习工程师对模型输出的不同描述:
- ML professional: “The model is 85% accurate in predicting Y, given a, b and c.”
- Statistician: “The model is 85% accurate in predicting Y, given a, b and c; and I am 90% certain that you will obtain the same result.”
machine learning model(algorithm model) .vs. statistical model的更多相关文章
- How do I learn machine learning?
https://www.quora.com/How-do-I-learn-machine-learning-1?redirected_qid=6578644 How Can I Learn X? ...
- Introducing: Machine Learning in R(转)
Machine learning is a branch in computer science that studies the design of algorithms that can lear ...
- Machine Learning - XV. Anomaly Detection异常检測 (Week 9)
http://blog.csdn.net/pipisorry/article/details/44783647 机器学习Machine Learning - Andrew NG courses学习笔记 ...
- 壁虎书1 The Machine Learning Landscape
属性与特征: attribute: e.g., 'Mileage' feature: an attribute plus its value, e.g., 'Mileage = 15000' Note ...
- Intro to Machine Learning
本节主要用于机器学习入门,介绍两个简单的分类模型: 决策树和随机森林 不涉及内部原理,仅仅介绍基础的调用方法 1. How Models Work 以简单的决策树为例 This step of cap ...
- Note for video Machine Learning and Data Mining——Linear Model
Here is the note for lecture three. the linear model Linear model is a basic and important model in ...
- A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning
A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning by Jason Brownlee on S ...
- (转)Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning
Introduction Optimization is always the ultimate goal whether you are dealing with a real life probl ...
- [Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族
声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面 记得在<Pattern Recognition And Machine ...
随机推荐
- Android之Activity界面跳转--生命周期方法调用顺序
这本是一个很基础的问题,很惭愧,很久没研究这一块了,已经忘得差不多了.前段时间面试,有面试官问过这个问题.虽然觉得没必要记,要用的时候写个Demo,打个Log就清楚了.但是今天顺手写了个Demo,也就 ...
- Disconf 学习系列之Disconf 的主要目标
不多说,直接上干货! 部署极其简单:同一个上线包,无须改动配置,即可在 多个环境中(RD/QA/PRODUCTION) 上线: 部署动态化:更改配置,无需重新打包或重启,即可 实时生效: 统一管理:提 ...
- c++ ‘nullptr’ 在此作用域中尚未声明
编译加上如下选项:-std=c++11 g++ 1.cpp -o k -std=c++11
- cmake:用add_subdirectory()添加外部项目文件夹
一般情况下,我们的项目各个子项目都在一个总的项目根目录下,但有的时候,我们需要使用外部的文件夹,怎么办呢? add_subdirectory命令,可以将指定的文件夹加到build任务列表中.下面是将与 ...
- docker 创建elasticsearch集群镜像
搞了2天终于搞好了 更新: 2017/2/15: 更改elasticsearch.yml中绑定ip, 可开启集群效果 //: supervisord.conf 加入 autostart=true, 开 ...
- 本地开启https的nginx配置
下载证书和key放置在nginx配置文件同级目录下,然后添加配置内容,监听443端口,如果本地443端口被占用,可以使用其他端口测试. server { listen 443; server_name ...
- org.springframework.beans.NullValueInNestedPathException
报错代码: HTTP Status 500 - An exception occurred processing JSP page /WEB-INF/views/input.jsp at line 2 ...
- CSS3 颜色属性
关键字颜色 red 十六进制颜色 #FF0000 RGB颜色 rgb(255,0,0) 新增的颜色表示方法 RGBa: RGB代表光的三原色,Red.Green和Blue CSS3中可以增加一个值 ...
- SQL查询几种的区别。
最近看了几篇SQL查询的文章做一下总结哦,大概简记如下: SQL查询的实质是,是指从数据库中取得数据的子集,可以先取列子集,然后再取符合条件的行子集. 1.单表查询: SELECT [Name] ,[ ...
- 我在项目中运用 IOC(依赖注入)--实战篇
上一篇<我在项目中运用 IOC(依赖注入)--入门篇>只是简单的使用 IOC.实际项目使用 IOC 的情景复杂多了,比如说,构造函数有多个参数,有多个类继承同一个接口... Unity都有 ...