本系列文章由 @YhL_Leo 出品,转载请注明出处。

文章链接: http://blog.csdn.net/yhl_leo/article/details/50112477


官方Web: https://www.csie.ntu.edu.tw/~cjlin/libsvm/

GitHub: https://github.com/cjlin1/libsvm

Tutorial: http://ntu.csie.org/~piaip/svm/svm_tutorial.html

1 库组成

Dos下运行程序有编译好的exe文件可以直接运行。例如本人的libSVM(版本为3.20)解压在E:\ClassTask\libsvm-3.20目录下:



其中heart_scale文件是一个libSVM库提供的训练示例样本,打开后可以发现里面是一堆这样的数据:



很容易看出,数据集结构是:

label vec{(index_1,value_1), ...(index_13, value_13)}

即两类观测值+1-1,后面的13维向量是每个样本某一特征的特征值。

进入windows子文件夹下有:

其中包含四个exe文件:

  • svm-predict:依照已经训练好的model ,输入新的数据,并输出预测新数据的类别。
  • svm-scale:有时候特征值的波动范围比较大需要对特征数据进行缩放,范围可以自己定,一般是[0,1]或[-1,1]。
  • svm-toy:图形界面,可以自己画点,产生数据,并显示/保存分类结果。
  • svm-train:会接受特定格式的训练输入文件,产生一个model 文件。

2 svm-train

首先来看svm-train,在Dos下切换到windows目录下(Win+R->cmd->切换盘符,cd切换文件夹),后输入命令:

> E:\ClassTask\libsvm-3.20\windows> svm-train ..//heart_scale ..//train.model

这里并没把heart_train文件拷入到windows下,而是在其前一层父目录中。如果已经拷到windows目录下,就无需..//

回车后很快就会出现:

其中:

  • #iter为迭代次数
  • nu是选择的核函数类型的参数
  • obj为SVM文件转换为的二次规划求解得到的最小值
  • rho为判决函数的偏置项b
  • nSV为标准支持向量个数(0<ai<c)
  • nBSV为边界上的支持向量个数(ai=c′)
  • Total nSV为支持向量总个数(对于两类来说,因为只有一个分类模型Total nSV = nSV,但是对于n类,Total nSV =∑ni=1nSV

打开train_model文件可以看到:

其中:

  • svm_type c_svc:所选择的svm类型,默认为c_svc
  • kernel_type rbf:训练采用的核函数类型,此处为RBF
  • gamma 0.0769231RBF核的参数γ
  • nr_class 2:类别数,此处为两分类问题
  • total_sv 132:支持向量总个数
  • rho 0.424462:判决函数的偏置项b
  • label 1 -1:原始文件中的类别标识
  • nr_sv 64 68:每个类的支持向量机的个数
  • SV:以下为各个类的权系数及相应的支持向量

3 svm-predict

再看svm-predict,利用刚刚训练完成的模型就可以进行分类:

> E:\ClassTask\libsvm-3.20\windows> svm-predict ..//heart_scale ..//train.model ..//train.out

回车后,就会得到一个生成文件train.out,同时Dos中也会输出分类精度:

即分类精度为86.6667%,而train.out文件打开后,每行只有-11表示样本的类别。

4 svm-scale

数据缩放的主要目的有两个:

  • 防止某个特征过大或过小,从而在训练中起的作用不平衡;
  • 为了计算速度。因为在核计算中,会用到内积运算或exp运算,不平衡的数据可能造成计算困难。

用法为:

> svm-scale -l lower -u upper -y y_lower y_upper -s save_filename -r restore_filename filename

其中:

  • -l:设定数据的下限值lower,缺省为-1
  • -u:设定数据的上限值upper,缺省为+1
  • -y:是否对目标值同时进行缩放,y_lower为下限值,y_upper为上限值
  • -s:表示将缩放的规则保存为文件save_filename
  • -r:表示将按照已经存在的规则文件restore_filename进行缩放
  • filename:待缩放的数据文件,文件格式按照libSVM格式

例如键入下面的指令:

E:\ClassTask\libsvm-3.20\windows>svm-scale -s ..//scaled.out ..//heart_scale > ..//save.data

就会生成两个文件scaled.outsave.data,可以自行查看其中的内容。

5 svm-toy

svm-toy是一个用户测试小工具,运行后如下:

随机用鼠标点一些点,然后点击change增加新的类别,例如随机画三类点:

点击run,可以得到分类结果:

LibSVM-windows的更多相关文章

  1. libsvm下的windows版本中的工具的使用

    下载的libsvm包里面已经为我们编译好了(windows).进入libsvm\windows,可以看到这几个exe文件: a.svm-toy.exe:图形界面,可以自己画点,产生数据等. b.svm ...

  2. Libsvm Matlab 快速安装教程 (适用于Win7+, 64bit, and Matlab2016a+)

    近日在开始学习Machine Learning SVM 相关算法,将Matlab平台安装SVM的步骤记录如下,亲测可用: 开发环境: Windows 8 64 bit, Matlab 2016a, S ...

  3. Libsvm:脚本(subset.py、grid.py、checkdata.py) | MATLAB/OCTAVE interface | Python interface

    1.脚本 This directory includes some useful codes: 1. subset selection tools. (子集抽取工具) subset.py 2. par ...

  4. Linux下的Libsvm使用历程录

    原文:http://blog.csdn.net/meredith_leaf/article/details/6714144 Linux下的Libsvm使用历程录 首先下载Libsvm.Python和G ...

  5. libsvm使用方法总结

    1.所需要软件下载: (1)libsvm(http://www.csie.ntu.edu.tw/~cjlin/libsvm/) (2)python (3)gnuplot 画图软件(ftp://ftp. ...

  6. python之基于libsvm识别数字验证码

    1. 参考 字符型图片验证码识别完整过程及Python实现 2.图片预处理和手动分类 (1)分析图片 from PIL import Image img = Image.open('nums/ttt. ...

  7. libsvm使用说明

    http://www.hankcs.com/ml/libsvm-usage.html libsvm使用说明 码农场 > 机器学习 2016-02-18 阅读(345) 评论(0)  目录   l ...

  8. LibSVM学习详细说明

    代码文件主要针对Matlab进行说明,但个人仍觉得讲解的支持向量机内容非常棒,可以做为理解这一统计方法的辅助资料; LibSVM是台湾林智仁(Chih-Jen Lin)教授2001年开发的一套支持向量 ...

  9. 转自网络用LIBSVM进行回归预测的粗浅认识————————作者师梦

    说一说我对用LIBSVM进行回归预测的粗浅认识(整理完成于2012年5.11) 作者 :  师梦       吾本工程小硕一枚,前用matlab建模,已然完成.某日,正沾沾自喜之际,吾师曰:“汝已为之 ...

  10. svm训练显示信息说明

    现简单对屏幕回显信息进行说明: #iter 为迭代次数, nu  与前面的操作参数 -n nu  相同, obj 为 SVM 文件转换为的二次规划求解得到的最小值, rho  为判决函数的常数项 b  ...

随机推荐

  1. laravel报错:Unable to detect application namespace.

    使用报错:Unable to detect application namespace. 是conposer.json格式不对

  2. ubuntu 12.04下安装Qt出现cannot execute binary file的解决方案

    最近在ubuntu 12.04下安装QT的过程中,遇到一个问题. ./qt-opensource-linux-x64-5.7.0.run出现了bash: ./qt-opensource-linux-x ...

  3. Linux配置nignx虚拟主机

    Nginx 是一个轻量级高性能的 Web 服务器, 并发处理能力强, 对资源消耗小, 无论是静态服务器还是小网站, Nginx 表现更加出色, 作为 Apache 的补充和替代使用率越来越高. 我在& ...

  4. 微信支付报ip错,怀疑是因为不能正确获取$_Server[addr])ip导致的

    报如下错误,应该是本地测试环境不能正确获取客户ip导致的错误 果然 放到服务器上在测试就好了

  5. 【Codeforces Round #476 (Div. 2) [Thanks, Telegram!] D】Single-use Stones

    [链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] 设长度为L的所有区间里面,石头的个数的最小值为k 设取到k的区间为l,r 那么k就为最多能通过的青蛙个数. 假设k再大一点.比如为k ...

  6. 【codeforces 812B】Sagheer, the Hausmeister

    [题目链接]:http://codeforces.com/contest/812/problem/B [题意] 一个老大爷在一楼; 然后他有n楼的灯要关(最多n楼); 每楼有m个房间; 给出每个房间的 ...

  7. 洛谷 P1518 两只塔姆沃斯牛 The Tamworth Two

    P1518 两只塔姆沃斯牛 The Tamworth Two 题目背景 题目描述 两只牛逃跑到了森林里.农夫John开始用他的专家技术追捕这两头牛.你的任务是模拟他们的行为(牛和John). 追击在1 ...

  8. iOS开发之十万个为什么&lt;1&gt;

    郝萌主倾心贡献,尊重作者的劳动成果,请勿转载. 假设文章对您有所帮助.欢迎给作者捐赠,支持郝萌主,捐赠数额任意,重在心意^_^ 我要捐赠: 点击捐赠 Cocos2d-X源代码下载:点我传送 游戏官方下 ...

  9. 通过setInterval函数在地图上每隔1s打一次点

    <?php echo <<<_END <!doctype html> <html> <head> <meta charset=&quo ...

  10. javascript系列-class4.函数

    欢迎加入前端交流群来py: 转载请标明出处!                   在火影的世界中存在忍术,忍术是把强大的能量集中在一起以各种各样不同的形式发射出来.怎样使用各种各样的忍术那?通过结印. ...