【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 1_Introduction and Basic Concepts 介绍和基本概念
目录
1.1 欢迎
1.2 机器学习是什么
1.2.1 机器学习定义
1.2.2 机器学习算法
- Supervised learning 监督学习
- Unsupervised learning 无监督学习
- Reinforcement learning 强化学习
- Recommender systems 推荐系统
1.2.3 课程目的
    如何在构建机器学习系统时,选择最好的实践类型决策、节省时间。
  1.3 监督学习
1.3.1 Regression 回归问题
1.3.2 Classification 分类问题
        1.3.3 回归和分类
  1.4 无监督学习
1.4.1 聚类算法 Clustering algorithm
1.2 机器学习是什么
参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv
1.2.1 机器学习定义
• Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。
• Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from
 experience E with respect to some task T and some performance measure
P, if its performance on T, as measured by P, improves with experience
E.     卡内基梅隆大学Tom 定义:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P, 当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。
例题,以垃圾邮件监测为例,解释Tom 定义中字母的对应:

1.2.2 机器学习算法
1、常用:
Supervised Learning 监督学习:学习数据带有标签
Unsupervised Learning 无监督学习:没有任何的标签,或者有相同的标签。已知数据集,不知如何处理,也未告知每个数据点是什么。


(右侧的例子,无监督学习将数据划分为两个集合,也就是聚类clustering algorithm)
2、其他:
Reinforcement learning 强化学习, recommender systems 推荐系统
1.2.3 课程目的
If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system. 如何在构建机器学习系统的时候选择最好的实践类型决策,节省时间。
1.3 监督学习
参考视频: 1- 3- Supervised Learning (12 min).mkv
1.3.1 Regression回归问题:预测结果是连续的输出值
在历史房价数据的基础上,预测房屋价格。可以使用直线拟合(粉色),也可以使用二次曲线拟合(蓝色)。
    
监督学习:基于已有的正确结果。 回归问题:预测连续的输出值
1.3.2 Classification分类问题:预测结果是离散的多个值
 
  
下图是基于两个特征(两个维度)进行预测的例子, 右边是其他可能维度(维度可能有无穷多个)

1.3.3 区分 “分类问题”和“回归问题”
例题:

1.4 无监督学习
参考视频: 1 - 4 - Unsupervised Learning (14 min).mkv
1.4.1 聚类算法clustering algorithm 在现实生活中的应用
1、Google News 每天将爬来的网址分为一个个的新闻专题。
2、基因信息分组。

3、组织大型计算机集群。 社交网络的分析。市场分割。天文数据分析

4、鸡尾酒party问题,将混在一起的多个音频源拆开。

通过这个例子,特别强调了Octave和MATLAB这些软件的简洁之处,这个算法的实现在Octave里只需要一行代码
[W,s,v] = svd((repmat(sum(x.*x,),size(x,),).*x)*x');
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 1_Introduction and Basic Concepts 介绍和基本概念的更多相关文章
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 15—Anomaly Detection异常检测
		Lecture 15 Anomaly Detection 异常检测 15.1 异常检测问题的动机 Problem Motivation 异常检测(Anomaly detection)问题是机器学习算法 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 16—Recommender Systems 推荐系统
		Lecture 16 Recommender Systems 推荐系统 16.1 问题形式化 Problem Formulation 在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 14—Dimensionality Reduction 降维
		Lecture 14 Dimensionality Reduction 降维 14.1 降维的动机一:数据压缩 Data Compression 现在讨论第二种无监督学习问题:降维. 降维的一个作用是 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 13—Clustering 聚类
		Lecture 13 聚类 Clustering 13.1 无监督学习简介 Unsupervised Learning Introduction 现在开始学习第一个无监督学习算法:聚类.我们的数据没 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 12—Support Vector Machines 支持向量机
		Lecture 12 支持向量机 Support Vector Machines 12.1 优化目标 Optimization Objective 支持向量机(Support Vector Machi ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 11—Machine Learning System Design 机器学习系统设计
		Lecture 11—Machine Learning System Design 11.1 垃圾邮件分类 本章中用一个实际例子: 垃圾邮件Spam的分类 来描述机器学习系统设计方法.首先来看两封邮件 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 10—Advice for applying machine learning 机器学习应用建议
		Lecture 10—Advice for applying machine learning 10.1 如何调试一个机器学习算法? 有多种方案: 1.获得更多训练数据:2.尝试更少特征:3.尝试更多 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别
		Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ... 
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 17—Large Scale Machine Learning 大规模机器学习
		Lecture17 Large Scale Machine Learning大规模机器学习 17.1 大型数据集的学习 Learning With Large Datasets 如果有一个低方差的模型 ... 
随机推荐
- 任务调度 Spring Task 4(一)
			深入浅出spring task定时任务 在工作中有用到spring task作为定时任务的处理,spring通过接口TaskExecutor和TaskScheduler这两个接口的方式为异步定时任务提 ... 
- aac adts & LATM封装码流分析
			本文继续上一篇文章的内容,介绍一个音频码流处理程序.音频码流在视频播放器中的位置如下所示. 本文中的程序是一个AAC码流解析程序.该程序可以从AAC码流中分析得到它的基本单元ADTS frame,并且 ... 
- Tomcat Jsp环境搭建全过程--重拾jsp
			搭建Jsp环境最简单的办法就是 Java+Tomcat 能很好的支持jsp代码 .首先,我们需要下载JDK和Tomcat安装包 JDK下载地址 http://www.oracle.com/techne ... 
- MS SQL Server2000转换成MySQL
			按计划今天着手进行将后台数据库从MS SQL Server2000转换成MySQL5.1.3.目的是便于发布软件的测试版本. 1. 驱动: mysql-connector-odbc-5.1.11-wi ... 
- bzoj 3192 删除物品
			Written with StackEdit. Description 箱子再分配问题需要解决如下问题: (1)一共有\(N\)个物品,堆成\(M\)堆. (2)所有物品都是一样的,但是它们有不同的优 ... 
- pmm监控页面502
			我们知道pmm主要使用的是 普罗米修斯采集和grafana日志统计显示. 最近为硬盘扩过一次容量,主要是docker使用的,我的pmm是跑在docker上的,但是重启后pmm的debug日志下载502 ... 
- Jam的计数法
			Jam的计数法 题目描述 Description Jam是个喜欢标新立异的科学怪人.他不使用阿拉伯数字计数,而是使用小写英文字母计数,他觉得这样做,会使世界更加丰富多彩.在他的计数法中,每个数字的位数 ... 
- Anaconda 使用conda常用命令
			1.首先在所在系统中安装Anaconda.可以打开命令行输入conda -V检验是否安装以及当前conda的版本. 2.conda常用的命令. 1)conda list 查看安装了哪些包. 2)con ... 
- Oracle变量的定义、赋值及使用
			首先我们来看看代码,然后我们在说明和解释代码: declare l_dept ; currtime date := sysdate; l_nam ) :),'yyyymmdd'); -- to_cha ... 
- 洛谷3004 [USACO10DEC]宝箱Treasure Chest
			题目:https://www.luogu.org/problemnew/show/P3004 一眼看上去就是记忆化搜索的dp.像 一双木棋 一样. 结果忘了记忆化.T了5个点. 然后加上记忆化.MLE ... 
