libsvm java版本使用心得（转）

http://blog.csdn.net/u010340854/article/details/19159883

https://github.com/cjlin1/libsvm

项目中要用到svm分类器，自己实现的话太费时间，于是寻找开源实现，找到了libsvm。

Java版本是一个jar包，引入到工程中即可使用。

需要注意的是，java版本充满了c++风格（类名小写，命名使用下划线_分隔等等），使用者需要稍微适应一下。

核心类是svm类，最常用的几个方法如下(都是static方法)：

svm.svm_load_model(String)，望文生义即可知是加载已训练好的svm模型，参数是模型文件名。

svm.svm_save_model(String,svm_model)，按指定的名称保存模型。

svm.svm_train(svm_problem，svm_parameter)，训练模型，该方法有两个参数svm_problem，保存了训练数据，包括数据数，特征数组，类别数组。参数svm_parameter用户设置svm的一些参数，例如svm_type设置svm类型，kernel_type设置核函数类型等。训练时需要注意的是，如果你的训练数据比较多，训练时间可能很长。

svm.svm_predict(svm_model,svm_node[])和svm.svm_p

redict_probability(svm_model,svm_node[],double[])，都用于预测类别，不同的是后一个方法同时包含了预测类别的概率。

下面给出完整的demo:

public class Test_svm_predict {
public static void main(String[] args) {
svm_problem sp = new svm_problem();
svm_node[][] x = new svm_node[4][2];
for (int i = 0; i < 4; i++) {
for (int j = 0; j < 2; j++) {
x[i][j] = new svm_node();
}
}
x[0][0].index = 1;
x[0][0].value = 0;
x[0][1].index = 2;
x[0][1].value = 0;
x[1][0].index = 1;
x[1][0].value = 1;
x[1][1].index = 2;
x[1][1].value = 1;
x[2][0].index = 1;
x[2][0].value = 0;
x[2][1].index = 2;
x[2][1].value = 1;
x[3][0].index = 1;
x[3][0].value = 1;
x[3][1].value = 0;
x[3][1].index = 2;
double[] labels = new double[]{-1,-1,1,1};
sp.x = x;
sp.y = labels;
sp.l = 4;
svm_parameter prm = new svm_parameter();
prm.svm_type = svm_parameter.C_SVC;
prm.kernel_type = svm_parameter.RBF;
prm.C = 1000;
prm.eps = 0.0000001;
prm.gamma = 10;
prm.probability = 1;
prm.cache_size=1024;
/*
* svm_check_parameter
* 参数可行返回null，否则返回错误信息
*/
System.out.println("Param Check " + (svm.svm_check_parameter(sp, prm)==null));
svm_model model = svm.svm_train(sp, prm); //训练分类
try {
svm.svm_save_model("svm_model_file", model);
} catch (IOException e) {
e.printStackTrace();
}
try {
svm.svm_load_model("svm_model_file");
} catch (IOException e) {
e.printStackTrace();
}
svm_node[] test = new svm_node[]{new svm_node(), new svm_node()};
test[0].index = 1;
test[0].value = 0;
test[1].index = 2;
test[1].value = 0;
double[] l = new double[2];
double result_prob = svm.svm_predict_probability(model, test,l); //测试1，带预测概率的分类测试
double result_normal = svm.svm_predict(model, test); //测试2 不带概率的分类测试
System.out.println("Result with prob " + result_prob);
System.out.println("Result normal " + result_normal);
System.out.println("Probability " + l[0] + "\t" + l[1]);
}
}

http://www.oschina.net/code/snippet_1246663_35454

1. [代码][Java]代码

100

101

102

103

104

import java.io.BufferedReader;

import java.io.File;

import java.io.FileReader;

import java.util.ArrayList;

import java.util.List;

import libsvm.svm;

import libsvm.svm_model;

import libsvm.svm_node;

import libsvm.svm_parameter;

import libsvm.svm_problem;

public class SVM {

public static void main(String[] args) {

// 定义训练集点a{10.0, 10.0} 和点b{-10.0, -10.0}，对应lable为{1.0, -1.0}

List<Double> label = new ArrayList<Double>();

List<svm_node[]> nodeSet = new ArrayList<svm_node[]>();

getData(nodeSet, label, "file/train.txt");

int dataRange=nodeSet.get(0).length;

svm_node[][] datas = new svm_node[nodeSet.size()][dataRange]; // 训练集的向量表

for (int i = 0; i < datas.length; i++) {

for (int j = 0; j < dataRange; j++) {

datas[i][j] = nodeSet.get(i)[j];

}

double[] lables = new double[label.size()]; // a,b 对应的lable

for (int i = 0; i < lables.length; i++) {

lables[i] = label.get(i);

}

// 定义svm_problem对象

svm_problem problem = new svm_problem();

problem.l = nodeSet.size(); // 向量个数

problem.x = datas; // 训练集向量表

problem.y = lables; // 对应的lable数组

// 定义svm_parameter对象

svm_parameter param = new svm_parameter();

param.svm_type = svm_parameter.EPSILON_SVR;

param.kernel_type = svm_parameter.LINEAR;

param.cache_size = 100;

param.eps = 0.00001;

param.C = 1.9;

// 训练SVM分类模型

System.out.println(svm.svm_check_parameter(problem, param));

// 如果参数没有问题，则svm.svm_check_parameter()函数返回null,否则返回error描述。

svm_model model = svm.svm_train(problem, param);

// svm.svm_train()训练出SVM分类模型

// 获取测试数据

List<Double> testlabel = new ArrayList<Double>();

List<svm_node[]> testnodeSet = new ArrayList<svm_node[]>();

getData(testnodeSet, testlabel, "file/test.txt");

svm_node[][] testdatas = new svm_node[testnodeSet.size()][dataRange]; // 训练集的向量表

for (int i = 0; i < testdatas.length; i++) {

for (int j = 0; j < dataRange; j++) {

testdatas[i][j] = testnodeSet.get(i)[j];

}

double[] testlables = new double[testlabel.size()]; // a,b 对应的lable

for (int i = 0; i < testlables.length; i++) {

testlables[i] = testlabel.get(i);

}

// 预测测试数据的lable

double err = 0.0;

for (int i = 0; i < testdatas.length; i++) {

double truevalue = testlables[i];

System.out.print(truevalue + " ");

double predictValue = svm.svm_predict(model, testdatas[i]);

System.out.println(predictValue);

err += Math.abs(predictValue - truevalue);

}

System.out.println("err=" + err / datas.length);

}

public static void getData(List<svm_node[]> nodeSet, List<Double> label,

String filename) {

try {

FileReader fr = new FileReader(new File(filename));

BufferedReader br = new BufferedReader(fr);

String line = null;

while ((line = br.readLine()) != null) {

String[] datas = line.split(",");

svm_node[] vector = new svm_node[datas.length - 1];

for (int i = 0; i < datas.length - 1; i++) {

svm_node node = new svm_node();

node.index = i + 1;

node.value = Double.parseDouble(datas[i]);

vector[i] = node;

}

nodeSet.add(vector);

double lablevalue = Double.parseDouble(datas[datas.length - 1]);

label.add(lablevalue);

}

} catch (Exception e) {

e.printStackTrace();

}

2. [代码]训练数据，最后一列为目标值

17.6,17.7,17.7,17.7,17.8

17.7,17.7,17.7,17.8,17.8

17.7,17.7,17.8,17.8,17.9

17.7,17.8,17.8,17.9,18

17.8,17.8,17.9,18,18.1

17.8,17.9,18,18.1,18.2

17.9,18,18.1,18.2,18.4

18,18.1,18.2,18.4,18.6

18.1,18.2,18.4,18.6,18.7

18.2,18.4,18.6,18.7,18.9

18.4,18.6,18.7,18.9,19.1

18.6,18.7,18.9,19.1,19.3

3. [代码]测试数据

18.7,18.9,19.1,19.3,19.6

18.9,19.1,19.3,19.6,19.9

19.1,19.3,19.6,19.9,20.2

19.3,19.6,19.9,20.2,20.6

19.6,19.9,20.2,20.6,21

19.9,20.2,20.6,21,21.5

20.2,20.6,21,21.5,22

4. [图片] QQ截图20140503213839.png