目录

1.1 欢迎
1.2 机器学习是什么

1.2.1 机器学习定义

1.2.2 机器学习算法

  - Supervised learning 监督学习

  - Unsupervised learning  无监督学习

  - Reinforcement learning 强化学习

  - Recommender systems 推荐系统

1.2.3 课程目的

    如何在构建机器学习系统时,选择最好的实践类型决策、节省时间。
  1.3 监督学习

     1.3.1 Regression 回归问题

     1.3.2 Classification 分类问题

        1.3.3 回归和分类
  1.4 无监督学习

     1.4.1 聚类算法 Clustering algorithm

1.2  机器学习是什么

   参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv

1.2.1  机器学习定义

• Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.  机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。

• Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from
experience E with respect to some task T and some performance measure
P, if its performance on T, as measured by P, improves with experience
E.     卡内基梅隆大学Tom 定义:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P, 当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。

  例题,以垃圾邮件监测为例,解释Tom 定义中字母的对应:

1.2.2  机器学习算法

1、常用:

  Supervised Learning 监督学习:学习数据带有标签

    Unsupervised Learning 无监督学习:没有任何的标签,或者有相同的标签。已知数据集,不知如何处理,也未告知每个数据点是什么。

       (右侧的例子,无监督学习将数据划分为两个集合,也就是聚类clustering algorithm)

2、其他:

    Reinforcement learning 强化学习, recommender systems 推荐系统

1.2.3  课程目的

  If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system. 如何在构建机器学习系统的时候选择最好的实践类型决策,节省时间。

1.3 监督学习

参考视频: 1- 3- Supervised Learning (12 min).mkv

1.3.1  Regression回归问题:预测结果是连续的输出值

   在历史房价数据的基础上,预测房屋价格。可以使用直线拟合(粉色),也可以使用二次曲线拟合(蓝色)。

    

    监督学习:基于已有的正确结果。           回归问题:预测连续的输出值

1.3.2  Classification分类问题:预测结果是离散的多个值

  

下图是基于两个特征(两个维度)进行预测的例子, 右边是其他可能维度(维度可能有无穷多个)

1.3.3  区分 “分类问题”和“回归问题”

    例题:

1.4 无监督学习

  参考视频: 1 - 4 - Unsupervised Learning (14 min).mkv

1.4.1  聚类算法clustering algorithm 在现实生活中的应用

  1、Google News 每天将爬来的网址分为一个个的新闻专题。

  2、基因信息分组。

3、组织大型计算机集群。 社交网络的分析。市场分割。天文数据分析

    

  4、鸡尾酒party问题,将混在一起的多个音频源拆开。

通过这个例子,特别强调了Octave和MATLAB这些软件的简洁之处,这个算法的实现在Octave里只需要一行代码

[W,s,v] = svd((repmat(sum(x.*x,),size(x,),).*x)*x');

【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 1_Introduction and Basic Concepts 介绍和基本概念的更多相关文章

  1. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 15—Anomaly Detection异常检测

    Lecture 15 Anomaly Detection 异常检测 15.1 异常检测问题的动机 Problem Motivation 异常检测(Anomaly detection)问题是机器学习算法 ...

  2. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 16—Recommender Systems 推荐系统

    Lecture 16 Recommender Systems 推荐系统 16.1 问题形式化 Problem Formulation 在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到 ...

  3. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 14—Dimensionality Reduction 降维

    Lecture 14 Dimensionality Reduction 降维 14.1 降维的动机一:数据压缩 Data Compression 现在讨论第二种无监督学习问题:降维. 降维的一个作用是 ...

  4. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 13—Clustering 聚类

    Lecture 13 聚类 Clustering 13.1 无监督学习简介  Unsupervised Learning Introduction 现在开始学习第一个无监督学习算法:聚类.我们的数据没 ...

  5. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 12—Support Vector Machines 支持向量机

    Lecture 12 支持向量机 Support Vector Machines 12.1 优化目标 Optimization Objective 支持向量机(Support Vector Machi ...

  6. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 11—Machine Learning System Design 机器学习系统设计

    Lecture 11—Machine Learning System Design 11.1 垃圾邮件分类 本章中用一个实际例子: 垃圾邮件Spam的分类 来描述机器学习系统设计方法.首先来看两封邮件 ...

  7. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 10—Advice for applying machine learning 机器学习应用建议

    Lecture 10—Advice for applying machine learning 10.1 如何调试一个机器学习算法? 有多种方案: 1.获得更多训练数据:2.尝试更少特征:3.尝试更多 ...

  8. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别

    Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...

  9. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 17—Large Scale Machine Learning 大规模机器学习

    Lecture17 Large Scale Machine Learning大规模机器学习 17.1 大型数据集的学习 Learning With Large Datasets 如果有一个低方差的模型 ...

随机推荐

  1. Intellij IDEA基于Springboot的远程调试

    简介 本篇博客介绍一下在Intellij IDEA下对Springboot类型的项目的远程调试功能.所谓的远程调试就是服务端程序运行在一台远程服务器上,我们可以在本地服务端的代码(前提是本地的代码必须 ...

  2. MySql 批量创建、导入实例

    1.创建sql(例如,taobao,dangdang): DROP DATABASE IF EXISTS taobao; CREATE DATABASE taobao CHARSET=utf8; US ...

  3. mysql基础认识1

    一.配置文件 服务端和客户端的字符编码不一样时,可能会导致乱码显示等情况,为了统一两端的字符编码,可以通过配置文件进行实现,当然譬如登录账户等信息也可以进行配置,在启动mysql服务端时会自动读取配置 ...

  4. linux 系统监控某目录下文件及文件夹的变化

    inotifywait 是一个可以实时监控文件变动的工具,它利用linux内核中的inotify机制实现监控功能. 查看内核版本 [root@Oracle ~]# uname -r 2.6.32-22 ...

  5. ranch实现游戏服务器

    在 erlang游戏开发tcp 我们建立起了自己的socket tcp 服务器的基本骨架.当时面对并发情况下,多人同一时刻连接服务器的时候,我们的基本骨架 还是难以应付处理.这就使我不得不想对这样的情 ...

  6. Oracle回收站 使用

    查询回收站 SELECT * FROM RECYCLEBIN; SELECT * FROM USER_RECYCLEBIN; --USER_RECYCLEBING与RECYCLEBIN是同义词,字段完 ...

  7. 微博6月底升级后 报 10017/2/statuses/share.json或者10014/2/statuses/share.json错误

    一,背景 2017-06-26微博公告替换了一些接口,导致以前的: statuses/repost 转发一条微博 statuses/update 发布一条微博 statuses/upload 上传图片 ...

  8. 给UIButton设置阴影及动画组

    //设置“开启旅程”按钮 UIButton *startBtn = self.startBtn; CGFloat btnW = ; CGFloat btnH = ; CGFloat btnX = (s ...

  9. Oracle备份与恢复案例

    注:以下内容来自<Oracle备份与恢复案例.doc>文档. Oracle备份与恢复案例 By Piner 一. 理解什么是数据库恢复 当我们使用一个数据库时,总希望数据库的内容是可靠的. ...

  10. Ubantu中安装sublime

    Sublime-text-3的安装步骤   添加Sublime-text-3软件包的软件源 sudo add-apt-repository ppa:webupd8team/sublime-text-3 ...