Coursera 机器学习第8章（上） Unsupervised Learning 学习笔记

8 Unsupervised Learning
8.1 Clustering
8.1.1 Unsupervised Learning: Introduction
集群（聚类）的概念。
什么是无监督学习：对于无标记无关联标记的数据，要求算法分析出数据的结构。
什么是聚类：将未加标签的数据分成有紧密关系的子集或者簇。

做道题：

ABC

8.1.2 K-Means Algorithm
讨论什么是K均值以及K均值的使用。K均值算法是一种迭代的聚类方法。

用图来展示K均值更加直观：
1.因为本例要将数据分为2类，所以要随进选择2个聚类中心（cluster centroid）。绿色的点表示的是未标记的样本。

2.迭代执行簇分配（centroid assignment）和移动聚类中心（Move the cluster centroids）：
while 聚类中心不再移动
　　簇分配，检查没有标记的点，将点的颜色染成距离它最近的那个聚类中心的颜色。（例子中是将图中的绿点根据距离红叉或者篮叉更近分配到两个不同的聚类中心）。
　　移动聚类中心，计算点的各维度的均值，将中心移动到与自己同一颜色的点群的均值位置。（将红叉或者篮叉移动到和它一样颜色的那堆点的均值处）。
end

具体过程从左向右，从上向下：

K均值算法描述：
输入：K个类别；训练集。

运行：簇分配+移动聚类中心。

如果遇到没有分配点的聚类中心，直接移除或者再随机找一个聚类中心，通常移除更加常见。算法见下图：

1.随机初始化K个聚类中心u₁,u₂,...,u_K。

2.while 聚类中心不再变化

　　簇分配：对于训练集的每个样本x⁽ⁱ⁾，置c⁽ⁱ⁾=距离x⁽ⁱ⁾最近的聚类中心编号k。这里就是求min_k||x⁽ⁱ⁾-u_k||²的k。

　　移动聚类中心：对于每个聚类中心k，置u_k=（所有c⁽ⁱ⁾=k的样本点的均值）。

end

做道题：

答案：

K均值的应对没有很好分开的簇：
市场细分的例子：将T恤分为小中大号。

下一节中讨论如何让K均值表现得更好一些

8.1.3 Optimization Objective
1.K均值的代价函数。保证K均值的正常运行。
2.如何利用K均值的代价函数来帮助K均值来找到更好的簇，避免局部最优解。
一些定义：c⁽ⁱ⁾、u_k和u_c⁽ⁱ⁾

K均值的代价函数也叫失真代价函数（distortion cost function）。

K均值算法的原理是最小化代价函数J的过程：簇分配就是在聚类中心不变时，求使代价函数J最小的c⁽¹⁾...c^(m)；移动聚类中心就是在c⁽¹⁾...c^(m)不变的情况下，求使代价函数最小的u_k。

做道题：

回归问题中有可能因为学习率设置过大产生随着迭代次数增加，cost function反倒增大的情况。但聚类是不会产生这样的问题的，因为每一次聚类都保证了使J下降，且无学习率做参数。

下节课帮助K均值找到更好的簇以及同时避免局部最优解。

8.1.4 Random Initialization
如何初始化K均值聚类中心，这会引导我们如何避开局部最优来构建K均值。

随机初始化：
1.K<m。

2.随机选择K个训练样本。

3.使聚类中心等于这些被选的K个样本。

KMeans的运行结果取决于KMeans的初始化。

避免局部最优的方法，提高K均值找到有可能的聚类的几率的方法是多次随机初始化。具体而言就是

1.随机初始化K均值。

2.执行K均值。

3.得到一系列的c，u值。

4.计算代价函数。

将以上4步多次执行，选取代价函数最小的一次作为最终结果。

如果聚类的k选取的比较小，多次随机初始化通常就会有个较好的局部最优解；但是如果k很大，那么多次随机初始化的效果就不太明显。

做道题：

8.1.5 Choosing the Number of Clusters
如何选择聚类分类数目K。没有自动选择的好方法：看可视化的图；看聚类分类的输出结果；手动决定（最常用）。
选择聚类的数目是困难的是因为数据中有多少个类通常是模棱两可的。比如下图：相同的数据样本情况

无监督学习中样本没有标签，所以结果没有清晰的答案。

其中的可能有用的一个方法：肘部法则（Elbow Method）。具体就是取不同的类别值K，分别计算不同K下的代价函数J，画图：

左图中出现一个突变点，这个点对应的K值就是可能的较好的分类数目K。在这个K前后，代价函数值有突变。K=3前代价函数值下降速度较快；K=3后代价函数值下降速度慢。像这样K=3的点，就是肘点（elbow）。但实际上也有可能出现像右边的图的情况，这时的肘点就没有左图那么明显。

出现上图右侧的情况时，更好地选择分类数目K的方法其实是看运行K均值的目的是什么。

比如T恤的例子：可以分为{S,M,L}，也可以分为{XS,S,M,L,XL}，具体看需求和目的。

做道题：

练习：

Coursera 机器学习第8章（上） Unsupervised Learning 学习笔记的更多相关文章

Coursera 机器学习第5章 Neural Networks: Learning 学习笔记
5.1节 Cost Function神经网络的代价函数. 上图回顾神经网络中的一些概念: L 神经网络的总层数. sl 第l层的单元数量(不包括偏差单元). 2类分类问题:二元分类和多元分类. 上 ...
Coursera 机器学习第7章 Support Vector Machines 学习笔记
7 Support Vector Machines7.1 Large Margin Classification7.1.1 Optimization Objective支持向量机(SVM)代价函数在数 ...
[Machine Learning]学习笔记-Logistic Regression
[Machine Learning]学习笔记-Logistic Regression 模型-二分类任务 Logistic regression,亦称logtic regression,翻译为" ...
Machine Learning 学习笔记
点击标题可转到相关博客. 博客专栏:机器学习 PDF 文档下载地址:Machine Learning 学习笔记机器学习 scikit-learn 图谱人脸表情识别常用的几个数据库机器学习 F1- ...
【机器学习】决策树（Decision Tree）学习笔记
[机器学习]决策树(decision tree) 学习笔记标签(空格分隔): 机器学习决策树简介决策树(decision tree)是一个树结构(可以是二叉树或非二叉树).其每个非叶节点表示一个 ...
【deep learning学习笔记】注释yusugomori的DA代码 --- dA.h
DA就是“Denoising Autoencoders”的缩写.继续给yusugomori做注释,边注释边学习.看了一些DA的材料,基本上都在前面“转载”了.学习中间总有个疑问:DA和RBM到底啥区别 ...
PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning --- 论文笔记
PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning ICLR 20 ...
Machine Learning 学习笔记1 - 基本概念以及各分类
What is machine learning? 并没有广泛认可的定义来准确定义机器学习.以下定义均为译文,若以后有时间,将补充原英文...... 定义1.来自Arthur Samuel(上世纪50 ...
吴恩达Machine Learning学习笔记（一）
机器学习的定义 A computer program is said to learn from experience E with respect to some class of tasks T ...

随机推荐

go-spew golang最强大的调试助手,没有之一
go内置的fmt.sprintf已经很强大了,但是和spew比起来还是相形见绌,这里来一个例子. import ( "fmt" "github.com/davecgh/g ...
Swoole http server + yaf, swoole socket server + protobuf 等小结
拥抱swoole, 拥抱更好的php Swoole 是什么? Yaf 是什么? 接触swoole已经4年多了,一直没有好好静下心来学习.一直在做web端的应用,对网络协议和常驻内存型服务器一窍不通.一 ...
Mac 安装 mysqlclient
尝试在虚拟环境下通过 pip 安装: pip install mysqlclient 然后报错:OSError: mysql_config not found 找到官方文档 https://githu ...
[Swift实际操作]九、完整实例-(3)创建和安装开发证书、发布证书及开发证书配置文件、发布证书配置文件
本文将为你演示,如何创建开发证书和发布证书,以及其他辅助内容.首先打开浏览器,进入[苹果开发者网站]输入[Apple ID]和[密码],点击登录按钮,进入开发者管理后台. 点击左侧的[Membersh ...
CentOS71611部署Django
web.conf <VirtualHost *:> WSGIScriptAlias / /var/www/datacn/datacn/wsgi.py Alias /static/ /var ...
条目十三《尽量使用vector和string来代替使用数组》
条目十三<尽量使用vector和string来代替使用数组> 数组在现代编程语言中基本都存在,应用可谓广泛,不可或缺,虽然在一些语言中(go)有切片等数据结构,但是数组还是存在的. 但是在 ...
C语言学习总结（1）——结构体
一,什么是结构体我们知道数组(Array),它是一组具有相同类型的数据的集合.但在实际的编程过程中,我们往往还需要一组类型不同的数据,例如对于学生信息登记表,姓名为字符串,学号为整数,年龄 ...
[转][Java]使用Spring配合Junit进行单元测试的总结
http://www.51testing.com/html/14/n-1408814.html 1.直接对spring中注入的bean进行测试(以DAO为例): 在测试类上添加@RunWith注解指定 ...
PyQt 5+qtDesigner
https://blog.csdn.net/view994/article/details/84402069 https://blog.csdn.net/yizhou2010/article/deta ...
springmvc相关配置和用法
目录如下: 一.spring mvc 核心类与接口二.spring mvc 核心流程图三.spring mvc DispatcherServlet说明四.spring mvc 父子上下文的说明 ...

Coursera 机器学习 第8章（上） Unsupervised Learning 学习笔记

Coursera 机器学习 第8章（上） Unsupervised Learning 学习笔记的更多相关文章

随机推荐

热门专题

Coursera 机器学习第8章（上） Unsupervised Learning 学习笔记

Coursera 机器学习第8章（上） Unsupervised Learning 学习笔记的更多相关文章