libsvm java版本使用心得(转)
http://blog.csdn.net/u010340854/article/details/19159883
https://github.com/cjlin1/libsvm
项目中要用到svm分类器,自己实现的话太费时间,于是寻找开源实现,找到了libsvm。
Java版本是一个jar包,引入到工程中即可使用。
需要注意的是,java版本充满了c++风格(类名小写,命名使用下划线_分隔等等),使用者需要稍微适应一下。
核心类是svm类,最常用的几个方法如下(都是static方法):
svm.svm_load_model(String),望文生义即可知是加载已训练好的svm模型,参数是模型文件名。
svm.svm_save_model(String,svm_model),按指定的名称保存模型。
svm.svm_train(svm_problem,svm_parameter),训练模型,该方法有两个参数svm_problem,保存了训练数据,包括数据数,特征数组,类别数组。参数svm_parameter用户设置svm的一些参数,例如svm_type设置svm类型,kernel_type设置核函数类型等。训练时需要注意的是,如果你的训练数据比较多,训练时间可能很长。
svm.svm_predict(svm_model,svm_node[])和svm.svm_p
redict_probability(svm_model,svm_node[],double[]),都用于预测类别,不同的是后一个方法同时包含了预测类别的概率。
下面给出完整的demo:
- public class Test_svm_predict {
- public static void main(String[] args) {
- svm_problem sp = new svm_problem();
- svm_node[][] x = new svm_node[4][2];
- for (int i = 0; i < 4; i++) {
- for (int j = 0; j < 2; j++) {
- x[i][j] = new svm_node();
- }
- }
- x[0][0].index = 1;
- x[0][0].value = 0;
- x[0][1].index = 2;
- x[0][1].value = 0;
- x[1][0].index = 1;
- x[1][0].value = 1;
- x[1][1].index = 2;
- x[1][1].value = 1;
- x[2][0].index = 1;
- x[2][0].value = 0;
- x[2][1].index = 2;
- x[2][1].value = 1;
- x[3][0].index = 1;
- x[3][0].value = 1;
- x[3][1].value = 0;
- x[3][1].index = 2;
- double[] labels = new double[]{-1,-1,1,1};
- sp.x = x;
- sp.y = labels;
- sp.l = 4;
- svm_parameter prm = new svm_parameter();
- prm.svm_type = svm_parameter.C_SVC;
- prm.kernel_type = svm_parameter.RBF;
- prm.C = 1000;
- prm.eps = 0.0000001;
- prm.gamma = 10;
- prm.probability = 1;
- prm.cache_size=1024;
- /*
- * svm_check_parameter
- * 参数可行返回null,否则返回错误信息
- */
- System.out.println("Param Check " + (svm.svm_check_parameter(sp, prm)==null));
- svm_model model = svm.svm_train(sp, prm); //训练分类
- try {
- svm.svm_save_model("svm_model_file", model);
- } catch (IOException e) {
- e.printStackTrace();
- }
- try {
- svm.svm_load_model("svm_model_file");
- } catch (IOException e) {
- e.printStackTrace();
- }
- svm_node[] test = new svm_node[]{new svm_node(), new svm_node()};
- test[0].index = 1;
- test[0].value = 0;
- test[1].index = 2;
- test[1].value = 0;
- double[] l = new double[2];
- double result_prob = svm.svm_predict_probability(model, test,l); //测试1,带预测概率的分类测试
- double result_normal = svm.svm_predict(model, test); //测试2 不带概率的分类测试
- System.out.println("Result with prob " + result_prob);
- System.out.println("Result normal " + result_normal);
- System.out.println("Probability " + l[0] + "\t" + l[1]);
- }
- }
http://www.oschina.net/code/snippet_1246663_35454
1. [代码][Java]代码
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
|
import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.util.ArrayList;import java.util.List;import libsvm.svm;import libsvm.svm_model;import libsvm.svm_node;import libsvm.svm_parameter;import libsvm.svm_problem;public class SVM { public static void main(String[] args) { // 定义训练集点a{10.0, 10.0} 和 点b{-10.0, -10.0},对应lable为{1.0, -1.0} List<Double> label = new ArrayList<Double>(); List<svm_node[]> nodeSet = new ArrayList<svm_node[]>(); getData(nodeSet, label, "file/train.txt"); int dataRange=nodeSet.get(0).length; svm_node[][] datas = new svm_node[nodeSet.size()][dataRange]; // 训练集的向量表 for (int i = 0; i < datas.length; i++) { for (int j = 0; j < dataRange; j++) { datas[i][j] = nodeSet.get(i)[j]; } } double[] lables = new double[label.size()]; // a,b 对应的lable for (int i = 0; i < lables.length; i++) { lables[i] = label.get(i); } // 定义svm_problem对象 svm_problem problem = new svm_problem(); problem.l = nodeSet.size(); // 向量个数 problem.x = datas; // 训练集向量表 problem.y = lables; // 对应的lable数组 // 定义svm_parameter对象 svm_parameter param = new svm_parameter(); param.svm_type = svm_parameter.EPSILON_SVR; param.kernel_type = svm_parameter.LINEAR; param.cache_size = 100; param.eps = 0.00001; param.C = 1.9; // 训练SVM分类模型 System.out.println(svm.svm_check_parameter(problem, param)); // 如果参数没有问题,则svm.svm_check_parameter()函数返回null,否则返回error描述。 svm_model model = svm.svm_train(problem, param); // svm.svm_train()训练出SVM分类模型 // 获取测试数据 List<Double> testlabel = new ArrayList<Double>(); List<svm_node[]> testnodeSet = new ArrayList<svm_node[]>(); getData(testnodeSet, testlabel, "file/test.txt"); svm_node[][] testdatas = new svm_node[testnodeSet.size()][dataRange]; // 训练集的向量表 for (int i = 0; i < testdatas.length; i++) { for (int j = 0; j < dataRange; j++) { testdatas[i][j] = testnodeSet.get(i)[j]; } } double[] testlables = new double[testlabel.size()]; // a,b 对应的lable for (int i = 0; i < testlables.length; i++) { testlables[i] = testlabel.get(i); } // 预测测试数据的lable double err = 0.0; for (int i = 0; i < testdatas.length; i++) { double truevalue = testlables[i]; System.out.print(truevalue + " "); double predictValue = svm.svm_predict(model, testdatas[i]); System.out.println(predictValue); err += Math.abs(predictValue - truevalue); } System.out.println("err=" + err / datas.length); } public static void getData(List<svm_node[]> nodeSet, List<Double> label, String filename) { try { FileReader fr = new FileReader(new File(filename)); BufferedReader br = new BufferedReader(fr); String line = null; while ((line = br.readLine()) != null) { String[] datas = line.split(","); svm_node[] vector = new svm_node[datas.length - 1]; for (int i = 0; i < datas.length - 1; i++) { svm_node node = new svm_node(); node.index = i + 1; node.value = Double.parseDouble(datas[i]); vector[i] = node; } nodeSet.add(vector); double lablevalue = Double.parseDouble(datas[datas.length - 1]); label.add(lablevalue); } } catch (Exception e) { e.printStackTrace(); } }} |
2. [代码]训练数据,最后一列为目标值
|
1
2
3
4
5
6
7
8
9
10
11
12
|
17.6,17.7,17.7,17.7,17.817.7,17.7,17.7,17.8,17.817.7,17.7,17.8,17.8,17.917.7,17.8,17.8,17.9,1817.8,17.8,17.9,18,18.117.8,17.9,18,18.1,18.217.9,18,18.1,18.2,18.418,18.1,18.2,18.4,18.618.1,18.2,18.4,18.6,18.718.2,18.4,18.6,18.7,18.918.4,18.6,18.7,18.9,19.118.6,18.7,18.9,19.1,19.3 |
3. [代码]测试数据
|
1
2
3
4
5
6
7
|
18.7,18.9,19.1,19.3,19.618.9,19.1,19.3,19.6,19.919.1,19.3,19.6,19.9,20.219.3,19.6,19.9,20.2,20.619.6,19.9,20.2,20.6,2119.9,20.2,20.6,21,21.520.2,20.6,21,21.5,22 |
4. [图片] QQ截图20140503213839.png

libsvm java版本使用心得(转)的更多相关文章
- ubuntu切换java版本
众所周知,ubuntu经常需要安装不同的java版本,他们之间的切换就是一个很大的问题 1.Chose another Java loader: sudo update-alternatives -- ...
- Java开发学习心得(二):Mybatis和Url路由
目录 Java开发学习心得(二):Mybatis和Url路由 1.3 Mybatis 2 URL路由 2.1 @RequestMapping 2.2 @PathVariable 2.3 不同的请求类型 ...
- Java开发学习心得(一):SSM环境搭建
目录 Java开发学习心得(一):SSM环境搭建 1 SSM框架 1.1 Spring Framework 1.2 Spring MVC Java开发学习心得(一):SSM环境搭建 有一点.NET的开 ...
- Java版本:识别Json字符串并分隔成Map集合
前言: 最近又看了点Java的知识,于是想着把CYQ.Data V5迁移到Java版本. 过程发现坑很多,理论上看大部分很相似,实践上代码写起来发现大部分都要重新思考方案. 遇到的C#转Java的一些 ...
- 你的程序支持复杂的时间调度嘛?如约而来的 java 版本
你的程序支持复杂的时间调度嘛? 这篇文章介绍了时间适配器的c#版本,是给客户端用的,服务器自然也要有一套对应的做法,java版本的 [年][月][日][星期][时间] [*][*][*][*][*] ...
- 崔用志-微信开发-java版本
崔用志-微信开发-java版本 今天看到一些关于微信开发的知识蛮好的博客,分享给大家,希望对大家有帮助. 微信开发准备(一)--Maven仓库管理新建WEB项目 微信开发准备(二)--springmv ...
- java版本区别
java版本区别 点我,点我,Eclipse几个版本号的区别(part1) 点我,点我,Eclipse几个版本号的区别(part2) 点我,点我,Eclipse几个版本号的区别(part3)
- javac。java版本切换
如果安装有多个Java版本时(有时候有些软件自行安装),怎样方便的进行切换呢.除了常见的设置环境变量外,今天学到了一种新的切换方法: update-alternatives --config java ...
- JGibbLDA:java版本的LDA(Latent Dirichlet Allocation)实现、修改及使用
转载自:http://blog.csdn.net/memray/article/details/16810763 一.概述 JGibbLDA是一个java版本的LDA(Latent Dirichl ...
随机推荐
- 使用COSBench工具对ceph s3接口进行压力测试
一.COSBench安装 COSBench是Intel团队基于java开发,对云存储的测试工具,全称是Cloud object Storage Bench 吐槽下,貌似这套工具是intel上海团队开发 ...
- github使用密钥登录
注册github之后 初次使用git的用户要使用git协议大概需要三个步骤: 一.生成密钥对 二.设置远程仓库(本文以github为例)上的公钥 一.生成密钥对 再window系统中可以通过x ...
- spring-boot 学习笔记一
参考博客:https://www.cnblogs.com/ityouknow/p/5662753.html 1.构建项目: 访问http://start.spring.io/,下载demo: 下载解压 ...
- /etc/vim/vimrc的一个的配置
(转)Vim 配置文件===/etc/vimrc "===================================================================== ...
- Rsync数据同步应用指南
1.软件简介 Rsync 是一个本地或远程数据同步工具,基于RSync算法,这个算法是澳大利亚人Andrew Tridgell发明的:可通过 LAN/WAN 快速同步多台主机间的文件.Rsync 本来 ...
- 极大既然估计和高斯分布推导最小二乘、LASSO、Ridge回归
最小二乘法可以从Cost/Loss function角度去想,这是统计(机器)学习里面一个重要概念,一般建立模型就是让loss function最小,而最小二乘法可以认为是 loss function ...
- CentOS网卡配置大全
持续更新中... 1.配置机器名 2.配置网卡属性 3.问题解决 3.1解决网卡经常需要手动重连问题 vi /etc/sysconfig/network-scripts/ifcfg-ens33 把ON ...
- SVN版本控制系统搭建(结合http服务)
SVN版本控制服务器搭建 Svn(subversion)是一个开源代码管理的控制系统,用来管理和存储开发的源代码,基于C/S模式.可以单独提供服务,也可以结合http服务来实现. 运行方式 运行端口 ...
- 如何用 Keynote 制作动画演示(转)
原文:如何用 Keynote 制作动画演示 Keynote 里的很多特效可以用来制作效果不错的演示,一页页的将需要演示的内容交代清楚后,直接输出成 m4v 的视频格式,为了方便贴到博客或者发布到 Tw ...
- Linux替换字符串
sed命令批量替换多个文件中的字符串: 命令:sed -i “s/原字符串/新字符串/g” `grep 原字符串 -rl 所在目录` 例如:我要把 xy 替换为 mn,执行命令: sed -i “s/ ...