1. 机器学习 (Machine Learning, ML)
     
     1.1 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
 
     1.2 学科定位:人工智能(Artificial Intelligence, AI)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
     
     1.3 定义:探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。
          
         Arthur Samuel (1959): 一门不需要通过外部程序指示而让计算机有能力自我学习的学科
 
         Langley(1996) : “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”
 
         Tom Michell (1997):  “机器学习是对能通过经验自动改进的计算机算法的研究”
 
     1.4: 学习:针对经验E (experience) 和一系列的任务 T (tasks) 和一定表现的衡量 P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力
 
              例子: 下棋,语音识别,自动驾驶汽车等
 
2)机器学习的应用:
       语音识别
       自动驾驶
       语言翻译
       计算机视觉
       推荐系统
       无人机
       识别垃圾邮件
3)机器学习的基本概念
  基本术语:
    (1)数据集:由若干记录组成的集合被称作做数据集(data set),记录是关于一个事件或者对象的描述。
    (2)属性(特征):对事物或者对象某一方面的表现或性质的事项,叫做属性(Attribute)。
    (3)属性空间(样本空间、输入空间):在属性上能够取到的范围,叫做属性空间(Attribute value)。
    (4)特征向量:将所有的属性张成一个空间,对于每个对象都能在空间上找到自己的坐标点,由于空间中的每个点对应的一个坐标向量,被称作特征向量(feature vector)。
    (5)维数:一般,如果有D = {X1,X2...Xm}表示M个实例的数据集,而对每一个示例有d个属性,这Xi =(xi1,xi2...xid)是d维样本空间的一个向量,xi属于样本空间(没有超出取值范围)那么成d成为样本xi的维数(dimensionnality)。
    (6)学习(训练):从数据学的模型的过程叫做学习(learning)或者训练(training)。
    (7)训练数据:在学习的过程中使用的数据,叫做训练数据(training data)。
    (8)训练样本:每个数据样本叫做训练样本(training sample)。
    (9)训练集:训练样本组成的集合叫做训练集(training set)。
    (10)标记:对与一组记录的标签叫做标记(label)。
    (11)样例:拥有标记信息的实例,叫做样例(example)。
    (12)标记空间(输出空间):一般,用(xi,yi)表示i个样例,其中yi属于Y是示例xi的标记,Y是所有标记的集合(标记的取值范围),Y被称作标记空间(Label space)。
4)机器学习分类:
  (1)监督学习
    分类和回归:分类有两种:第一种是二分类,通常的标记为两个值,这一种叫做分类,另一种是多值分类,通常标记是连续的值,叫做回归。(提前知道标记)
  (2)无监督学习
    聚类:将训练集中的训练数据分成若干组,每个组被称为一个簇,这些自动形成的簇可能对应一些潜在的概念划分。(提前不知道,数据训练时会形成簇。)
  (3)强化学习
 
 
未完待续...
    
  

Python机器学习第一章的更多相关文章

  1. web前端学习python之第一章_基础语法(二)

    web前端学习python之第一章_基础语法(二) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...

  2. web前端学习python之第一章_基础语法(一)

    web前端学习python之第一章_基础语法(一) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...

  3. [Python笔记][第一章Python基础]

    2016/1/27学习内容 第一章 Python基础 Python内置函数 见Python内置函数.md del命令 显式删除操作,列表中也可以使用. 基本输入输出 input() 读入进来永远是字符 ...

  4. python 教程 第一章、 简介

    第一章. 简介 官方介绍: Python是一种简单易学,功能强大的编程语言,它有高效率的高层数据结构,简单而有效地实现面向对象编程.Python简洁的语法和对动态输入的支持,再加上解释性语言的本质,使 ...

  5. 机器学习第一章——NFL的个人理解

    第一篇博客,想给自己的学习加深记忆.看到书中第一个公式时,本来想直接看证明结果就好,然鹅...作者在备注上写:这里只用到一些非常基础的数学知识,只准备读第一章且有“数学恐惧”的读者可跳过...嘤嘤嘤, ...

  6. python学习 第一章(说不定会有第零章呢)one day

    ------------恢复内容开始------------ 一.啥是python python是吉尔·范罗苏姆于1989年开发的一个新的脚本解释程序,是ABC语言的一种继承. 二.python的特点 ...

  7. Python【第一章】:简介和入门

    ython简介 Python的创始人为Guido van Rossum.1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做为ABC 语言的一种继承.之 ...

  8. 进击的Python【第一章】:Python背景初探与Python基础(一)

    Python背景初探 一.Python起源 Python的创始人为Guido van Rossum.1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做 ...

  9. 《head first python》第一章《初识python》总结

    该章主要介绍了python的安装和列表相关 列表主要用了movies做介绍: 1.列表及嵌套列表:movies=["the hodaliy",1975,"zhangyim ...

随机推荐

  1. maven+springMVC(一)

    [目录]

  2. winserver-记录共享文件夹操作日志

    abstract 1.在共享文件夹上开启审计. 2.在日志中查看操作记录. 开启审计 共享文件夹属性 选择审计 添加审计用户 选择用户及审计事件 日志查看 运行eventvwr 在windowslog ...

  3. mysql(mariadb)主从配置

    环境: 内核版本:uname -r 系统版本:cat /etc/redhat-release

  4. Diagnostics: File file:/tmp/spark-95cbb984-da28-4784-8b99-eb83ad74437f/__spark_libs__1421840316395076250.zip does not exist

    搭建spark环境,测试在yarn 上运行spark shell的时候出现的错误:Diagnostics: File file:/tmp/spark-95cbb984-da28-4784-8b99-e ...

  5. 在Windows7中的DPI与主题的问题

    测试环境Windows7x64,vb6.0 测试在XP系统下,DPI计算似乎没问题 Screen.TwipsPerPixelX=1440/DPI=1440/96=15Screen.TwipsPerPi ...

  6. 我的Windows日常——你的小电影藏好了吗?

    Hello!           everybody! 记得大三,第一次上我们某主任的课(我是计算机学部的),某主任上课的第一件事,点名,第二件事,忽悠我们. 具体忽悠步骤如下: 某:”同学们,这里有 ...

  7. Ubuntu 16.04 安装GIMP绘图软件

    Ubuntu上比较好用的绘图软件,GIMP,安装方法如下: 终端输入 : sudo apt-get install gimp ,回车,输入密码,即可安装简单易行. 输入 :gimp ,启动程序.

  8. Java实现遍历N级树形目录结构

    最近挺忙,一直在做项目,然后有个树形目录结构需要返回给前端,这里给大家说一下实现的思路. 具体达到的效果类似: 一级目录A: 二级目录A: 三级目录: 四级目录: 文件.txt 二级目录B: 文件1. ...

  9. winform 仿web 滑块验证

    winform 仿web 滑块验证 效果如下: 源码下载地址: https://download.csdn.net/download/u011392711/11109687

  10. CSAPP:第十二章 并发编程

    CSAPP:第十二章 并发编程 12.1 线程执行模型12.2 多线程之间并发通信12.3 其他并发问题   使用应用级并发的应用程序称为并发程序.现代操作系统提供三种基本的构造并发程序的方法: 进程 ...