SVMtrain的参数c和g的优化

晨凫追风 2024-08-30 11:30:42 原文

SVMtrain的参数c和g的优化

在svm训练过程中，需要对惩罚参数c和核函数的参数g进行优化，选取最好的参数

知道测试集标签的情况下

是让两个参数c和g在某一范围内取离散值，然后，取测试集分类准确率最佳的参数

不知道测试集标签的情况下

（1）利用交叉验证的方法：(k-fold cross validation)

Start
bestAccuracy = 0
bestc = 0
bestg = 0
//n1 , n2 ,k都是事先给定的值
for c = 2^(-n1) : 2^(n1)
for g = 2^(-n2) : 2^(n2)
将训练集平均分为k部分，设为
train(1),train(2), ... ,train(k).
分别让每一部分作为测试集进行预测（剩下的k-1部分作为训练集对分类器进行训练）取得最后得到的所有分类的准确率的平均数，设为cv
if（cv>bestAccuracy)
bestAccuracy = cv; bestc = c; bestg = g
end
end
end
over

（2）leave-one-out cross validation(loo交叉验证)

设原始数据有N个样本，那么LOO-CVj就是N-CV,即每一个样本作为验证集，其余的N-1个样本作为训练集，所以在LOO-CV下会得到N个模型，用N个模型的最终验证集的分类准确率的平均数做为在LOO-CV下分类器的性能指标

**　但是LOO-cv计算量太大，每个样本都要建立一个模型，计算成本太大

当计算出所有的c和g时，这时候这些c和g有可能会出现的是：某些成对出现的c和g验证准确率一样高，这时候选择的是惩罚参数最小的c和g，认为c小的那个对象是最佳的选择

伪代码如下

bestAccuracy = 0

bestc = 0

bestg = 0

//将c和g划分为网格进行搜索

for c = 2 ^(cmin):2(cmax)

for c = 2 ^(gmin):2(gmax)

%%采用K-CV方法

将train大致分为K组，记为train(1)train(2)…train(k)

相应的标签也要分离出来记为train_label(1),train_label(2)…train_label(k)

for run = 1:k

让train（run），作为验证集，其他的作为训练集，记录此时的验证准确率为acc（run）

end

cv = (acc(1)+acc(2)+…acc(k))/k

if (cv>bestAccuracy)

bestAccury = cv;bestc=c;bestg=g;

end

end

end

over

SVMtrain的参数c和g的优化的更多相关文章

Deep Learning.ai学习笔记_第二门课_改善深层神经网络：超参数调试、正则化以及优化
目录第一周(深度学习的实践层面) 第二周(优化算法) 第三周(超参数调试.Batch正则化和程序框架) 目标: 如何有效运作神经网络,内容涉及超参数调优,如何构建数据,以及如何确保优化算法快速运行, ...
DeepLearning.ai学习笔记（二）改善深层神经网络：超参数调试、正则化以及优化--Week2优化算法
1. Mini-batch梯度下降法介绍假设我们的数据量非常多,达到了500万以上,那么此时如果按照传统的梯度下降算法,那么训练模型所花费的时间将非常巨大,所以我们对数据做如下处理: 如图所示,我 ...
svmtrain输入参数介绍【转】
-s svm类型:SVM设置类型(默认0) 0 -- C-SVC 1 --v-SVC 2 – 一类SVM 3 -- e -SVR 4 -- v-SVR -t 核函数类型:核函数设置类型(默认2) 0 ...
gcc/g++ -O 优化选项说明
查查gcc手册就知道了,每个编译选项都控制着不同的优化选项下面从网络上copy过来的,真要用到这些还是推荐查阅手册 -O设置一共有五种:-O0.-O1.-O2.-O3和-Os. 除了-O0以外,每一 ...
Andrew Ng - 深度学习工程师 - Part 2. 改善深层神经网络：超参数调试、正则化以及优化（Week 2. 优化算法）
===========第2周优化算法================ ===2.1 Mini-batch 梯度下降=== epoch: 完整地遍历了一遍整个训练集 ===2.2 理解Mini-bat ...
[NOI2009]诗人小G 四边形优化DP
题目传送门 f[i] = min(f[j] + val(i,j); 其中val(i,j) 满足四边形dp策略. 代码: #include<bits/stdc++.h> using nam ...
PyTorch官方中文文档：torch.optim 优化器参数
内容预览: step(closure) 进行单次优化 (参数更新). 参数: closure (callable) –...~ 参数: params (iterable) – 待优化参数的iterab ...
优化Linux内核参数提高服务器负载能力
首先,编辑一下/etc/sysctl.conf 文件,调整一下以下参数,如果没有经过优化的Linux内核可能没有这些参数,那么把需要补充的复制添加进去即可,其他设置默认即可,不需要理解. 记得修改完成 ...
linux内核参数注释与优化
目录 1.linux内核参数注释 2.两种修改内核参数方法 3.内核优化参数生产配置参数解释由网络上收集整理,常用优化参数对比了网上多个实际应用进行表格化整理,使查看更直观. 学习linux也有不少 ...

随机推荐

MAC 下用 brew 搭建 PHP 开发环境
Mac下用brew搭建PHP(LNMP/LAMP)开发环境 Mac下搭建lamp开发环境很容易,有xampp和mamp现成的集成环境.但是集成环境对于经常需要自定义一些配置的开发者来说会非常麻烦,而且 ...
Oracle 10g DG 环境搭建详解
环境描述:线上招聘库在物理机上,需要上云主机,于是申请两台云主机:由于云主机变态性,分配的云主机具有很多局限性:1.没有/tmp,2.没有 swap 3. /home 目录非常小:于是申请两块云硬盘, ...
部分NodeJs
一.cnmp的操作: 1.cnmp info jquery查询jquery的版本: 2.cnmp install jquery@1.11.1:安装: 3.cnmp list查询所有下载的内容: 4.c ...
Python中int()函数的用法浅析
int()是Python的一个内部函数 Python系统帮助里面是这么说的 >>> help(int) Help on class int in module __builti ...
php获取字符串的编码格式的方法（函数）
// 检测字符的编码格式 $encode = mb_detect_encoding($string, array('ASCII','UTF-8','GB2312','GBK','BIG5')); ec ...
光荣之路测试开发面试linux考题之四：性能命令
Hi,大家好我是tom,I am back.今天要给大家讲讲linux系统一些性能相关命令. 1.fdisk 磁盘管理是一个强大的危险命令,所有涉及磁盘的操作都由该命令完成,包括:新增磁盘.增删改磁 ...
小Z的袜子题解报告【莫队】
Description 作为一个生活散漫的人,小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿.终于有一天,小Z再也无法忍受这恼人的找袜子过程,于是他决定听天由命-- 具体来说,小Z把这N只 ...
玲珑学院oj 1152 概率dp
1152 - Expected value of the expression Time Limit:2s Memory Limit:128MByte Submissions:128Solved:63 ...
Codeforces 17.E Palisection
E. Palisection time limit per test 2 seconds memory limit per test 128 megabytes input standard inpu ...
洛谷P1455 搭配购买
题目描述明天就是母亲节了,电脑组的小朋友们在忙碌的课业之余挖空心思想着该送什么礼物来表达自己的心意呢?听说在某个网站上有卖云朵的,小朋友们决定一同前往去看看这种神奇的商品,这个店里有n朵云,云朵已经 ...