ML机器学习导论学习笔记
机器学习的定义:
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习的应用实例:
1.学习关联性
在零售业中,机器学习的应用就是购物篮分析,任务就是发现顾客所购商品之间的关联性。
2.分类
2.1信贷行业,做好风险评估,以及做好银行贷款问题中的信用评分。还有就是做好预测,通过学习过去的数据,例如收入和存款等,然后预测此客户的是高风险客户还是低风险客户。
2.2 机器学习在模式识别中也有应用,其中之一就是光学字符识别(optional character recognition,OCR),即从字符图像识别字符编码。
2.3 人脸识别,输入的是人脸图像,类是需要识别的人,并且学习程序应当学习人脸图像与身份之间的关联性。
2.4 医学诊断。输入的是患者的信息,而类是疾病。
2.5 语音识别。输入的是语音,类是可以读出的词汇。语音方面的难题就是每个人、每个地域的说话不一样。这是未来的研究领域。
2.6 生物测定学,使用人的生理和行为特征来识别或认证人的身份,需要集成来自不同形态的输入。生理特征的例子是面部图像、指纹、虹膜和手掌;行为特征的例子是:签字的力度、嗓音、步态和击键。
2.7 机器学习还可以进行压缩,用规则拟合数据,能够得到比数据更简单的解释,需要的存储空间更少,处理需要的计算更少。
2.8 离群点检测,即发现哪些不遵守规则的例外实例。
3. 回归
机器学习的应用例子:对机器人的导航,例如现在的自动驾驶汽车导航。
4. 非监督学习
在监督学习中,目标是学习从输入到输出的映射关系,其中的输出是正确值已经由指导者提供。
非监督学习是没有指导者,单纯只有输入数据,目标是发现输入的数据中的规律。
密度估计的概念:
输入空间存在某种结构,使得特定的模式比其他的模式更常出现,而我们希望知道哪些常发生,那些不常发生,在统计学中,称之为密度估计(Density estimation)
密度估计的方法:聚类———目标是发现输入数据的蔟和分组。
聚类的应用之一————图像压缩,输入实例是由RGB值表示的图像像素。
在文本聚类中,目标是把相似的文档分组。
5. 增加学习
机器学习程序就是应当能够评估策略的好坏程度,并从以往的动作序列中学习,以便能够产生策略,这种学习方法称之为增强学习(Reinforcement learning)算法。
参考书籍:《机器学习导论》
ML机器学习导论学习笔记的更多相关文章
- TensorFlow机器学习框架-学习笔记-001
# TensorFlow机器学习框架-学习笔记-001 ### 测试TensorFlow环境是否安装完成-----------------------------```import tensorflo ...
- 机器学习技法--学习笔记04--Soft SVM
背景 之前所讨论的SVM都是非常严格的hard版本,必须要求每个点都被正确的区分开.但是,实际情况时很少出现这种情况的,因为噪声数据时无法避免的.所以,需要在hard SVM上添加容错机制,使得可以容 ...
- Spark.ML之PipeLine学习笔记
地址: http://spark.apache.org/docs/2.0.0/ml-pipeline.html Spark PipeLine 是基于DataFrames的高层的API,可以方便用户 ...
- 【机器学习实战学习笔记(2-2)】决策树python3.6实现及简单应用
文章目录 1.ID3及C4.5算法基础 1.1 计算香农熵 1.2 按照给定特征划分数据集 1.3 选择最优特征 1.4 多数表决实现 2.基于ID3.C4.5生成算法创建决策树 3.使用决策树进行分 ...
- 【机器学习实战学习笔记(1-1)】k-近邻算法原理及python实现
笔者本人是个初入机器学习的小白,主要是想把学习过程中的大概知识和自己的一些经验写下来跟大家分享,也可以加强自己的记忆,有不足的地方还望小伙伴们批评指正,点赞评论走起来~ 文章目录 1.k-近邻算法概述 ...
- Python scikit-learn机器学习工具包学习笔记:feature_selection模块
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction. Univariate feature selecti ...
- 机器学习基石--学习笔记01--linear hard SVM
背景 支持向量机(SVM)背后的数学知识比较复杂,之前尝试过在网上搜索一些资料自学,但是效果不佳.所以,在我的数据挖掘工具箱中,一直不会使用SVM这个利器.最近,台大林轩田老师在Coursera上的机 ...
- Python scikit-learn机器学习工具包学习笔记
feature_selection模块 Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标 ...
- 机器学习 MLIA学习笔记(一)
监督学习(supervised learning):叫监督学习的原因是因为我们告诉了算法,我们想要预测什么.所谓监督,其实就是我们的意愿是否能直接作用于预测结果.典型代表:分类(classificat ...
随机推荐
- 《LeetBook》leetcode题解(6): ZigZag Conversion[E]
我现在在做一个叫<leetbook>的免费开源书项目,力求提供最易懂的中文思路,目前把解题思路都同步更新到gitbook上了,需要的同学可以去看看 书的地址:https://hk029.g ...
- jgGrid注销表格(动态修改表头)以及前台分页
实例代码 <!doctype html> <html lang="en"> <head> <meta charset="UTF- ...
- unity编辑器教程
https://blog.csdn.net/candycat1992/article/details/52067975
- JavaScript自增、自减
JavaScript自增.自减运算符与表达式语法 var i++; var-- 声明变量 i-- 变量名 ++ -- 自增运算符 JavaScript自增.自减运算符与表达式 JavaScript自增 ...
- ViewPager(视图滑动切换工具)
<?xml version="1.0" encoding="utf-8"?> <android.support.constraint.Cons ...
- 转:详解PV、UV、VV、IP及其关系与计算
一.什么是PV? PV即Page View,网站浏览量,指页面浏览的次数,用以衡量网站用户访问的网页数量.用户每次打开一个页面便记录1次PV,多次打开同一页面则浏览量累计.一般来说,PV与来访者的数量 ...
- shell获取时间的相关命令
Linux shell获取时间和时间间隔(ms级别) 说明:在进行一些性能测试的时候,有时候我们希望能计算一个程序运行的时间,有时候可能会自己写一个shell脚本方便进行一些性能测试的控制(比如希望能 ...
- 图标插件FusionChartsFree
二.介绍 Ø FusionCharts 是InfoSoft Global 公司的一个产品,InfoSoft Global 公司是专业的Flash 图形方案提供商,他们还有几款其他的,基于Flash 技 ...
- Java基础教程(7)--运算符
现在,我们已经学会了如何声明和初始化变量,但你可能想知道如何操作它们.运算符是对一个,两个或三个操作数执行特定操作并返回结果的特殊符号.下表列出了Java中的运算符: 表格中的运算符是按照从上 ...
- Git建立独立分支
前言 在码云建立git项目后默认分支是master, 这里如果直接在码云新建分支, 会指定默认分支; 所以通过git 命令git checkout --orphan 新分支名 创建独立分支 创建 创建 ...