1.2 [what is machine learning?]
1.人:observation -->  learing  -->  skill
机器:data --> ML --> improved performance measure /skill
2.什么情况下适合使用机器学习:
(1)some 'underlying pattern' to be learned
(2)not easy(programmable) definition :不是很容易写出一些规则去处理
(3)data about the pattern : inputs
3.example(best suited ML):
(1)预测婴儿在下一次哪个时间点会哭?  no:  (1)no pattern
(2)判断一个图像中是否包含圆形?  yes   no: (2)很容易写definitioin/program
(3)判断是否给一个用户发放信用卡?  yes  :(1)user behavior (2)not easily program(3)data
(4)地球是否hi在未来十年因为滥用核能而毁灭? no: (3)no data yet

1.3[applications of ML]
1.Food(某家餐厅是否会引起食物中毒)
data:twitter+location
skill:tell food poisoning likeliness of restaurant
2.Clothing
data:sales figures销售数据 + client surveys顾客喜好
skill:give good recommendations to clients
3.Housing
data:characteristics of building and their energy load耗能状况
skill:predict energy load of other buildings closely
4.transportation
data:traffic sign images and meanings交通标志
skill:recognize traffic signs accurately
 5.Education
data:students' records on quizzes on a math tutoring system
skill:predict whether a student can give a correct answer to another quiz question
 
answer correctly~~[recent strength of student > difficulty of question]
data:9 million records from students
ML determines(reverse-engineers)  strength and difficult auto
6.Entertainment
data:how many users have rated some movies
skill:predict how a user would rate an unrated movie
 
data: 1亿 ratings that 480,189 users gave to 17,770 movies(Netflix 线上租赁DVD)
 1.4Formalize the learning problem
input:x->X
output:y->Y
f:X->Y
data: D{(x1,y1),(x2,y2),,,}
hypothesis -> skill  g:x->y
 
{(x n , y n )} from f  -->ML-->  g
A:algorithm
H:hypothesis     利用A从H的众多假设里选择一个最接近f的g.
 
1.5data mining数据挖掘/AI:Artificial Intelligence/Statistics
DM :use huge data to find property that is interesting
ML = DM(KDDCups)
AI:
ML can realize AI,
eg. 下棋:(传统方法:game tree; ML: learning from board data)
Statistics:use data to make inference about unknown process
    g is an inference outcome(预测推论的结果) ;f is something unknown

statistics can be used to achieve ML

[what is machine learning?]的更多相关文章

  1. 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系?

    本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答 ...

  2. Example-based Machine Learning是什么?

    参考:https://christophm.github.io/interpretable-ml-book/proto.html EML简介 Example-based Machine Learnin ...

  3. 【Machine Learning】KNN算法虹膜图片识别

    K-近邻算法虹膜图片识别实战 作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...

  4. 【Machine Learning】机器学习及其基础概念简介

    机器学习及其基础概念简介 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...

  5. 【Machine Learning】决策树案例:基于python的商品购买能力预测系统

    决策树在商品购买能力预测案例中的算法实现 作者:白宁超 2016年12月24日22:05:42 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本 ...

  6. 【机器学习Machine Learning】资料大全

    昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...

  7. [Machine Learning] Active Learning

    1. 写在前面 在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi ...

  8. [Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族

    声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面 记得在<Pattern Recognition And Machine ...

  9. Machine Learning Algorithms Study Notes(6)—遗忘的数学知识

    机器学习中遗忘的数学知识 最大似然估计( Maximum likelihood ) 最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数.这个方法最早是遗传学家 ...

随机推荐

  1. centos7 安装python2.7与3共存

    1.CentOS7默认安装了python2.7.5 2.下载python,到官网下载最新版本. 安装命令为 wget "https://www.python.org/ftp/python/x ...

  2. web页面中快速找到html对应元素两种方法

    一.第一种方法(通过先进入开发模式然后再去选择网页元素) 1.打开IE.Chrome.FireFox等,按 F12 键进入开发模式 2.在打开的控制窗口左上角有个  箭头 按钮,点击它之后,此时将鼠标 ...

  3. Android中如何使用xmlns

    http://blog.csdn.net/lihenair/article/details/41009711 工作中时常需要自定义控件,除了按键,draw以外,还需要对控件属性进行一些初始化的操作,比 ...

  4. 扑克牌游戏-华为OJ-C++实现

    /*扑克牌游戏大家应该都比較熟悉了.一副牌由54张组成,含3~A.2各4张,小王1张.大王1张.牌面从小到大用例如以下字符和字符串表示(当中.小写joker表示小王,大写JOKER表示大王): 3 4 ...

  5. 【洛谷】【最小生成树】P1536 村村通

    [题目描述:] 某市调查城镇交通状况,得到现有城镇道路统计表.表中列出了每条道路直接连通的城镇.市政府"村村通工程"的目标是使全市任何两个城镇间都可以实现交通(但不一定有直接的道路 ...

  6. for-in和for-of,forEach和Map

    for-in和for-of 1. for-in循环实际是为循环”enumerable“对象而设计的,是用来循环带有字符串key的对象的. 使用for in会遍历数组所有的可枚举属性,包括原型.所以fo ...

  7. 转载 线程池 异步I/O线程 <第三篇>

    在学习异步之前先来说说异步的好处,例如对于不需要CPU参数的输入输出操作,可以将实际的处理步骤分为以下三步: 启动处理: 实际的处理,此时不需要CPU参数: 任务完成后的处理: 以上步骤如果仅仅使用一 ...

  8. MATLAB的两种移位运算

    MATLAB的两种移位运算: 1)circshift矩阵移位 circshift:循环移位数组 语法:B = circshift(A,shiftize) 说明: B  = circshift(A,sh ...

  9. 【Codeforces Round 1129】Alex Lopashev Thanks-Round (Div. 1)

    Codeforces Round 1129 这场模拟比赛做了\(A1\).\(A2\).\(B\).\(C\),\(Div.1\)排名40. \(A\)题是道贪心,可以考虑每一个站点是分开来的,把目的 ...

  10. SkylineGlobe 邻近度(Proximity)分析JavaScript源代码

    邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,是空间分析的一个重要手段. <html xmlns="http://www.w3.org/1999/xhtml&qu ...