在octave语言中K-means聚类算法求聚类中心的向量化计算
使用octave编程的时候,一定要注意使用向量化编程的思想,下面我就说说我今天做题遇到的一个K-means聚类问题,如何使用octave中的函数向量计算聚类中心centroids。
octave几个函数:
bsxfun:
二元操作函数,调用方式: bsxfun (F, A, B),A为 向量、二维矩阵或多维矩阵,B也为 向量、二维矩阵或多维矩阵,F为二元操作函数。如果 A 和 B 维度数不一样,或者 对应维度长度不一样,此函数会首先尝试把 A 和 B 都broadcast 到相同维度,且对应维度长度相同的两个向量。然后,再把A和B中一一的两个元素使用二元函数F做计算,返回的结果是与broadcast之后的A和B相同维度、对应维度相同长度的一个向量。
例如:
A = [1, 2, 3]; #这里A 可以看做是行向量
B = [1, 2, 3]; #这里B 可以看做是行向量
C = bsxfun(@plus, A, B);
则 C = [2, 4, 6]
因为它天生支持broadcast,所以如果必须要broadcast,系统不会产生 “warning: operator +: automatic broadcasting operation applied”
警告。
例如:
A2 = A'; # 这里表示 撇号的作用就是求转置。即C是A向量的转置 ,即C是列向量。
D = bsxfun(@plus, A2, B);
则 D = [ 2, 3, 4,
3, 4, 5,
4, 5, 6]
解释:
发现A2是3×1,B是1×3,于是将A2 broadcast 到3×3,其他两列拷贝第一列的值;B 也broadcast到3×3,
其他两行拷贝第一行的值;接着,将A2与B对应位置的元素,进行plus操作,这里是求和操作,于是得到结果D。
accumarray:
分组计算函数,调用方式: accumarray (SUBS, VALS, SZ, FUNC, FILLVAL, ISSPARSE),SUBS为一个数组,
其元素内容为新的数组下标值,VALS为一个数组,其元素为要进行操作的数值,缺省的动作是 sum 求和操作。
例如:
A = [1, 2, 3, 4]' #注意A为列向量
B = [1, 2, 1, 2]' #注意B为列向量
C = accumarray(B, A)
则 C = [4, 6]' #注意C为列向量。
解释:
B的值对应分配到新的数组的对应下标,由于B(1) = B(3) = 2,于是A(1),A(3) 的值分到C(1),且缺省FUNC是求和操作,
于是C(1)=A(1)+A(3) = 4,同理C(2) = A(2) + A(4) = 6
accumarray函数调用,返回的结果是一维向量,如果想返回矩阵呢,那就必须用到下面的accumdim函数。
accumdim:
分组计算函数,调用方式:accumdim (SUBS, VALS, DIM, N, FUNC, FILLVAL)
例如:
A = [1, 1, 1; 2, 2, 2; 3, 3, 3; 4, 4, 4] #A为4×3矩阵
B = [1, 2, 1, 2]' #B为列向量
C = accumdim(B, A)
则 C = [ 4, 4, 4; 6, 6, 6] #2×3矩阵。
解释,简单的说,就是将A矩阵中的行向量,按B下标分组,每组中的向量对应列求和,得到新的一个向量。
假设,X为样本点矩阵,m×n,表示m个样本点,n个特征;idx为一维列向量,其值为m个样本点对应的聚类下标,取值(1..K),即K个聚类。
centroids即为K个聚类中心,为K×n矩阵,每一行表示一个中心,第k行表示第k个聚类的中心。现在要求新的聚类中心。
代码如下:
position = unique(idx) cmeans = accumdim(idx, X, 1, 0, @mean) centroids(position, :) = cmeans
在octave语言中K-means聚类算法求聚类中心的向量化计算的更多相关文章
- K-Means 聚类算法原理分析与代码实现
前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...
- [聚类算法] K-means 算法
聚类 和 k-means简单概括. 聚类是一种 无监督学习 问题,它的目标就是基于 相似度 将相似的子集聚合在一起. k-means算法是聚类分析中使用最广泛的算法之一.它把n个对象根据它们的属性分为 ...
- Spark:聚类算法
Spark:聚类算法 Kmeans聚类 KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇.然后按平均法重新计算各个簇的质心,从而确定新的簇心.一直迭代,直到簇 ...
- 第十三篇:K-Means 聚类算法原理分析与代码实现
前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...
- 浅谈K-means聚类算法
K-means算法的起源 1967年,James MacQueen在他的论文<用于多变量观测分类和分析的一些方法>中首次提出 “K-means”这一术语.1957年,贝尔实验室也将标准算法 ...
- 挑子学习笔记:两步聚类算法(TwoStep Cluster Algorithm)——改进的BIRCH算法
转载请标明出处:http://www.cnblogs.com/tiaozistudy/p/twostep_cluster_algorithm.html 两步聚类算法是在SPSS Modeler中使用的 ...
- 机器学习六--K-means聚类算法
机器学习六--K-means聚类算法 想想常见的分类算法有决策树.Logistic回归.SVM.贝叶斯等.分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别 ...
- 【聚类算法】谱聚类(Spectral Clustering)
目录: 1.问题描述 2.问题转化 3.划分准则 4.总结 1.问题描述 谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图 ...
- k-means均值聚类算法(转)
4.1.摘要 在前面的文章中,介绍了三种常见的分类算法.分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应.但是很多时候上述条件得不到满足,尤其是在 ...
随机推荐
- Jquery树控件ZTree异步加载
异步加载的意思就是: 当点击展开树节点时,才去请求后台action返回点击节点的子节点数据并加载. 这里面主要设计ztree的setting变量的async属性设置: var setting = { ...
- Singleton ——运行时全局唯一对象
Singleton 运行时全局唯一对象 Singleton模式只解决一个问题,如何做到运行时创建一个全局唯一的对象? 1:隐藏类的实例化操作,即将构造函数声明为private或protected.任何 ...
- cmd下载文件
进入cmd 输入ftp 192.168.1.200 然后按照提示输入用户名和密码 cd 进入要下载的目录 dir 看操作权限 lcd查看本地要装下载文件的目录 prompt关闭交互模式 mget da ...
- UVALive 4031 Integer Transmission(贪心 + DP)
分析:求出最大值和最小值比较简单,使用贪心法,求最小值的时候我们让所有的0尽可能的向后延迟就可以了,求最大值则相反. 关键在于求出可以组合出的数字个数. 这就是组合数学版的dp了,我们让dp[i][j ...
- ZOJ 3913 Bob wants to pour water
ZOJ Monthly, October 2015 K题 二分答案+验证 #include<iostream> #include<algorithm> #include< ...
- springMVC下载文件前修改文件名字
很多时候,为了方便,下载文件其实就直接写了一个文件在服务器上面的路径,然后直接点击一个这个地址,浏览器就自然而然的开始下载了. 但是这次项目需要在文件下载之前修改文件的名字,也就是说,服务器上文件的名 ...
- hdu_5555_Immortality of Frog(状压DP)
题目连接:hdu_5555_Immortality of Frog 题意: 给你一个NxN的网格,第N行的每一列都有个青蛙,这些青蛙只会往上走,上帝会在每个膜中放一个长生不老的药,一共有N个膜,每个膜 ...
- 【转】PHP代码审计
PHP代码审计 目录 1. 概述3 2. 输入验证和输出显示3 2.1 命令注入4 2.2 跨站脚本4 2.3 文件包含5 2.4 代码注入5 2.5 SQL注入6 2.6 XPath注入6 2.7 ...
- 关于submit与document.form1.submit();这2个提交的区别
首先要知道 一个是按钮提交 一个是在js函数里写代码 document.form1.submit() 提交 区别如下: 从使的方式及效主要有二点区别吧.一.使用submit()提交时,表单中不能存在s ...
- error=11, Resource temporarily unavailable
问题1:Cannot run program "/bin/ls": error=11, Resource temporarily unavailable 1 15/04/22 14 ...