支持向量机(SVM)理论总结系列.线性可分(附带R程序案例:用体重和心脏重量来预测一只猫的性别)
附注:不要问我为什么写这么快,是16年写的。
1.名词解释
支持向量机中的机:在机器学习领域,常把一些算法看做一个机器,如分类机(也叫作分类器)
2.问题描述
空间中有很多已知类别的点,现在想用一个面分开他们,并能对未知类别的点很好的识别类别。
3.算法思想
由问题描述可知,现在算法要解决两个问题:
找到一个平面,可以很好的区分不同类别的点,即使分类器的训练误差小,线性可分时要求训练误差为0。
很好的识别未知类别样本的类别,即多大程度上信任该分类器在未知样本上分类的效果。
令满足以上两点的超平面方程为:
图1 画图展示
4.公式推导
这里接着上一步,公式推导如何求w和b,下图2所示。
图2 公式推导
5.程序实现(案例)
案例介绍:用体重和心脏重量来预测一只猫的性别。
语言:R语言,可在线安装e1071包,亦可在libsvm网站下载后安装程序包。
网址:http://www.csie.ntu.edu.tw/~cjlin/libsvm/
#数据集来自MASS包的cats数据集 #下面的程序将实现用体重和心脏重量来预测一只猫的性别 library(e1071) data(cats,package="MASS") summary(cats) inputData=data.frame(cats[, c (2,3)], Sex= as.factor(cats$Sex)) train=inputData[1:108,]#训练集 test=inputData[109:144,]#测试集 #初步建模 x=train[,-3] y=train[,3] #核函数选择高斯核函数 model1=svm(x,y,kernel='radial',gamma=if(is.vector(x)) 1 else1/ncol(x)) #计算训练误差,结果显示有14个样本类别错误 z=test[,-3] zy=test[,3] zy=as.integer(zy) pred1=predict(model1,x) table(pred1,y) #优化模型 attach(train)#将数据集train按列单独确认为向量 type=c("C-classification","nu-classification","one-classification") kernel=c("linear","polynomial","radial","sigmoid") pred2=array(0,dim=c(108,3,4)) accuracy=matrix(0,3,4) yy=as.integer(y) for(i in 1:3) { for(j in 1:4) { pred2[,i,j]=predict(svm(x,y,type=type[i],kernel=kernel[j]),x) if(i>2) accuracy[i,j]=sum(pred2[,i,j]!=1) else accuracy[i,j]=sum(pred2[,i,j]!=yy) } } #12种组合算法在训练集上的误差 wrong=matrix(0,3,4) for(i in 1:3) { for(j in 1:4) { wrong[i,j]=mean(yy != pred2[,i,j])#错误率占比 } } #选择训练集上误差最小的三种组合,计算在测试集上的误差,三种组合在训练集上的错误率分别为0.241,0.259,0.278;三种组合分别是nu-classification+radial、C-classification+linear组合和C-classification+radial组合。 pred3=array(0,dim=c(108,3,4)) for(i in 1:3) { for(j in 1:4) { pred3[,i,j]=predict(svm(x,y,type=type[i],kernel=kernel[j]),z) if(i>2) accuracy[i,j]=sum(pred3[,i,j]!=1) else accuracy[i,j]=sum(pred3[,i,j]!=yy) } } mean(zy != pred3[,2,3]) mean(zy != pred3[,1,1]) mean(zy != pred3[,1,3]) #计算结果分别为0.417,0,0 #在测试集上错误率为0的两种算法分别是C-classification+linear组合和C-classification+radial组合。
end!
支持向量机(SVM)理论总结系列.线性可分(附带R程序案例:用体重和心脏重量来预测一只猫的性别)的更多相关文章
- 更新几篇之前写在公众号上的文章:线性可分时SVM理论推导;关联分析做捆绑销售和推荐;分词、去停用词和画词云
适合阅读人群:有一定的数学基础. 这几篇文章是16年写的,之前发布在个人公众号上,公众号现已弃用.回过头来再看这几篇文章,发现写的过于稚嫩,思考也不全面,这说明我又进步了,但还是作为学习笔记记在这里了 ...
- 统计学习:线性支持向量机(SVM)
学习策略 软间隔最大化 上一章我们所定义的"线性可分支持向量机"要求训练数据是线性可分的.然而在实际中,训练数据往往包括异常值(outlier),故而常是线性不可分的.这就要求我们 ...
- 以图像分割为例浅谈支持向量机(SVM)
1. 什么是支持向量机? 在机器学习中,分类问题是一种非常常见也非常重要的问题.常见的分类方法有决策树.聚类方法.贝叶斯分类等等.举一个常见的分类的例子.如下图1所示,在平面直角坐标系中,有一些点 ...
- 机器学习(二)—支持向量机SVM
1.SVM的原理是什么? SVM是一种二类分类模型.它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器.(间隔最大是它有别于感知机) 试图寻找一个超平面来对样本分割,把样本中的正例和反例 ...
- 支持向量机SVM基本问题
1.SVM的原理是什么? SVM是一种二类分类模型.它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器.(间隔最大是它有别于感知机) 试图寻找一个超平面来对样本分割,把样本中的正例和反例 ...
- 支持向量机SVM——专治线性不可分
SVM原理 线性可分与线性不可分 线性可分 线性不可分-------[无论用哪条直线都无法将女生情绪正确分类] SVM的核函数可以帮助我们: 假设‘开心’是轻飘飘的,“不开心”是沉重的 将三维视图还原 ...
- OpenCV支持向量机SVM对线性不可分数据的处理
支持向量机对线性不可分数据的处理 目标 本文档尝试解答如下问题: 在训练数据线性不可分时,如何定义此情形下支持向量机的最优化问题. 如何设置 CvSVMParams 中的参数来解决此类问题. 动机 为 ...
- 线性可分支持向量机与软间隔最大化--SVM(2)
线性可分支持向量机与软间隔最大化--SVM 给定线性可分的数据集 假设输入空间(特征向量)为,输出空间为. 输入 表示实例的特征向量,对应于输入空间的点: 输出 表示示例的类别. 我们说可以通过间隔最 ...
- 线性可分支持向量机--SVM(1)
线性可分支持向量机--SVM (1) 给定线性可分的数据集 假设输入空间(特征向量)为,输出空间为. 输入 表示实例的特征向量,对应于输入空间的点: 输出 表示示例的类别. 线性可分支持向量机的定义: ...
随机推荐
- RabbitMQ消息队列(三):任务分发机制
在上篇文章中,我们解决了从发送端(Producer)向接收端(Consumer)发送“Hello World”的问题.在实际的应用场景中,这是远远不够的.从本篇文章开始,我们将结合更加实际的应用场景来 ...
- JAVA WEB 中的编码分析
JAVA WEB 中的编码分析 */--> pre.src {background-color: #292b2e; color: #b2b2b2;} pre.src {background-co ...
- UVa 311 - Packets
题目大意:有1X1,2X2 ... 5X5,6X6六种类型的物品,把他们装进6X6的盒子里,求使用的最少盒子数. 贪心吧,其实一看就知道思路了,算是常识吧,装物品时通常都是先装大的,再在其余空间放小的 ...
- jquery中html()或text()方法获取或设置p标签的值
html()方法可以用来读取或者设置某个元素中的HTML内容,text()方法可以用来读取或者没置某个元素中的文本内容 html()方法 此方法类似于JavaScript中的innerHTML属性,可 ...
- iOS 类库列表
1. LinqToObjectiveC #import "NSArray+LinqExtensions.h" 它为NSArray添加了许多方法,能让你用流式API来转换.排序.分 ...
- Frameset使用教程
frame,是网页开发必须掌握的知识.例如后台架构.局部刷新,页面分割,都是frame的用途表现,尤其是后台页面制作,使用frame会给用户带来非常舒适的使用感受. frame知识点包括(frames ...
- 【翻译】在Visual Studio中使用Asp.Net Core MVC创建你的第一个Web API应用(一)
HTTP is not just for serving up web pages. It's also a powerful platform for building APIs that expo ...
- spring 里面的StringUtils,先放这儿,有时间研究吧
/* * Copyright 2002-2012 the original author or authors. * * Licensed under the Apache License, Vers ...
- STL内存管理
1. 概述 STL Allocator是STL的内存管理器,也是最低调的部分之一,你可能使用了3年stl,但却不知其为何物. STL标准如下介绍Allocator the STL includes s ...
- #图# #SPFA# ----- codevs1021 玛丽卡
codevs1021 玛丽卡 题目描述 Description麦克找了个新女朋友,玛丽卡对他非常恼火并伺机报复.因为她和他们不住在同一个城市,因此她开始准备她的长途旅行.在这个国家中每两个城市之间最多 ...