Machine Learning 之二,什么监督性学习,非监督性学习。
1.什么是监督性学习?Supervised Machine Learning.
在监督性学习,我们给定一个数据集以及我们已经知道正确输出的结果,然后找到一个输入和输出的关系。
In Supervised learning,we are given a data set and already know what our correct output should look like ,having the idea that there is a relationship between the input and output.
监督性学习的问题被分为两大类,第一类是回归问题,第二类是分类问题。在回归问题,我们试着预测结果在连续输出,意味着我们试图将输入变量映射到某个连续函数。在分类问题中,相反,我们试图预测离散输出的结果。换句话说,我们试图将输入变量映射到离散类别中。
监督性学习目的是在构建能够根据存在不确定性的证据做出预测的模型。监督性学习算法接受已知的输入数据集和对数据的已知响应输出,然后训练模型,让模型能够未新输入数据的响应生成合理的预测。
监督性学习采用分类(classification)和(regression)技术开发预测模型。
1.分类技术可预测离散的响应(输出)--例如:
电子邮件是真正的邮件还是垃圾邮件,肿瘤是恶性还是良性。分类模型可将输入数据划分不同类别。典型应用包括:医学成像,语音识别,信用评估。
2,回归技术可预测连续的响应--例如,电力需求中温度或波动的变化。
典型的应用包括:电力系统负荷预测和算法交易。
应用:
使用监督性学习预测心脏病发作
假设临床医生希望预测某位患者在一年内是否会心脏病发作,他们有一千就医患者的患者相关数据,包括年龄,体重,身高以及血压。他们呢hi到一千的患者在一年内是否出现过心脏病发作,因此,问题在于如何将现有数据合并到模型中,并让该模型能够预测新患者在一年内是否出现心脏病发作。
2. 什么是非监督性学习?UnSupervised Machine Learning.
非监督性学习可发现数据中隐藏的模式或内在结构,这种技术可包含未标记响应的输入数据的数据集执行推理。
聚类是一种最常用的无监督性学习技术,这种技术可通过探索性数据分析发现数据中隐藏的模式或分组。
聚类的应用包括基因序列分析,市场调查和对象识别。


总结:
监督性机器学习就是根据已知的输入和输出训练模型,让模型能够预测未来输出。
非监督性机器学习就是从输入数据中找出隐藏模式或内在结构。

那么如何确定使用哪种算法?
选择正确的算法看似难以驾驭,需要从几十种监督性学习和非监督性学习算法中选择,每种算法又包含不同的学习方法。
没有最佳方法和完全之策。找到正确的算法知识是错过程的一部分,即使经验丰富的数据科学家,也无法说出某种算法是否无需试错即可使用,但是算法的选择还却决我们要处理数据的大小以及类型,要从数据中获取洞察力以及如何使用这些洞察力。这才是机器学习的开始。。

PS:
知识引用
吴恩达的机器学习
matlab的机器学习
Machine Learning 之二,什么监督性学习,非监督性学习。的更多相关文章
- 斯坦福大学公开课机器学习:machine learning system design | data for machine learning(数据量很大时,学习算法表现比较好的原理)
下图为四种不同算法应用在不同大小数据量时的表现,可以看出,随着数据量的增大,算法的表现趋于接近.即不管多么糟糕的算法,数据量非常大的时候,算法表现也可以很好. 数据量很大时,学习算法表现比较好的原理: ...
- 学习笔记之机器学习(Machine Learning)
机器学习 - 维基百科,自由的百科全书 https://zh.wikipedia.org/wiki/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0 机器学习是人工智能的一个分 ...
- 我的Machine Learning学习之路
从2016年年初,开始用python写一个简单的爬虫,帮我收集一些数据. 6月份,开始学习Machine Learning的相关知识. 9月开始学习Spark和Scala. 现在想,整理一下思路. 先 ...
- 【转载】 我的Machine Learning学习之路
原文地址: https://www.cnblogs.com/steven-yang/p/5857964.html ------------------------------------------- ...
- 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 17—Large Scale Machine Learning 大规模机器学习
Lecture17 Large Scale Machine Learning大规模机器学习 17.1 大型数据集的学习 Learning With Large Datasets 如果有一个低方差的模型 ...
- data mining,machine learning,AI,data science,data science,business analytics
数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics ...
- 数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系?
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答 ...
- 【Machine Learning】监督学习、非监督学习及强化学习对比
Supervised Learning Unsupervised Learning Reinforced Learning Goal: How to apply these methods How t ...
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
随机推荐
- null-ouc 小组冲刺阶段博客目录
null-ouc Beta冲刺阶段博客目录 github:https://github.com/orgs/OUC-null/people 一.Scrum Meeting 1. [第十周会议记录](h ...
- LUOGU P4587 [FJOI2016]神秘数(主席树)
传送门 解题思路 如果区间内没有\(1\),那么答案就为\(1\),从这一点继续归纳.如果区间内有\(x\)个\(1\),设区间内\([2,x+1]\)的和为\(sum\),如果\(sum=0\),那 ...
- python 国内镜像加速
原因 经常在使用Python的时候需要安装各种模块,而pip是很强大的模块安装工具但是由于国外官方默认pip访问速度慢,经常被墙,导致无法安装,所以我们最好是将自己使用的pip源更换一下,这样就能解决 ...
- 对业务类进行构造的工厂类BLLFactory
using System; using System.Collections.Generic; using System.Text; using System.Collections; using W ...
- Struts1.3——使用MyEclipse集成工具开发Struts
前面两篇通过手工写代码,手工配置struts-config.xml文件的方法来开发了一个最简单的struts项目,通过手工的方式旨在学习底层原理细节.当熟悉了以后,我们就不需要再通过纯手工的方式来开发 ...
- java 多级图的最短路径
求最短路径众所周知有Dijistra算法.Bellman-ford等,除了这些算法,用动态规划也可以求出最短路径,时间复杂度为O(n^2), 跟没有优化的Dijistra算法一样(优化后的Dijist ...
- JPA单向和双向关系
单向关系 @JoinColumn 双向关系 @OneToMany @ManyToMany mappedBy
- gdb调试已在运行中的进程
一.在服务器上调试进程,服务器上并没有源代码,所以需要将源码上传至服务器,才能调试看到源码,以下是步骤: 1.查看服务进程id:pgrep 服务名 [user@user-MP app]$ pgrep ...
- 在Ubuntu下安装source Insight
在ubuntu中,安装windows程序用wine,然后用wine安装windows软件即可. 安装wine sudo apt-get install wine 下载sourceinsight的exe ...
- BiLSTM介绍
https://www.jiqizhixin.com/articles/2018-10-24-13 (机器之心)