libsvm Minist Hog 手写体识别(源码文件)
以上是我上一篇文章中的代码实现,里面分别用了opencv中的SVM和LibSVM,opencv的SVM用起来更方便,但貌似内部其实也是基于Libsvm,同样的参数训练出来的结果是一致的,里面有Libsvm的调用过程,如果用libsvm需要在工程里面添加libsvm的源码文件分别是svm.h和svm.cpp,林智仁的库里自带的那两个核心文件即可。
libsvm的用法让人更感觉是在用C的写法,opencv封装过的易用性更好,稍后我会把工程文件放到github上供大家下载,若有什么错误,还请批评指教~,这里用的是Minist的数据集,图像时我经过处理后的单张图像,大小为20*20,里面有详细的函数使用说明
[https://github.com/YihangLou/SVM-Minist-HandWriting-Recognition] Github上的工程链接
// DigitsRec_HOG_SVM.cpp : 定义控制台应用程序的入口点。
#include "opencv2/opencv.hpp"
#include "fstream"
#include "svm.h"
using namespace std;
using namespace cv;
#define srcfeature
vector<string> trainImageList;//训练图像列表,此处路径
vector<int> trainLabelList; //标签
vector<string> testImageList;//训练图像列表,此处路径
string trainImageFile= "D:\\WorkSpace\\homework\\PatternRecognization\\第一次作业\\minist\\train_image\\imagelist.txt";
string testImageFile = "D:\\WorkSpace\\homework\\PatternRecognization\\第一次作业\\minist\\test_image\\imagelist.txt";
string testBasePath = "D:\\WorkSpace\\homework\\PatternRecognization\\第一次作业\\minist\\test_image\\";
string trainBasePath = "D:\\WorkSpace\\homework\\PatternRecognization\\第一次作业\\minist\\train_image\\";
string SVMModel ="svm_model.xml";
CvMat * dataMat;
CvMat * labelMat;
//***************************************************************
// 名称: readTrainFileList
// 功能: 读取训练的图像列表和图像的位置
// 权限: public
// 返回值: void
// 参数: string trainImageFile 文件列表
// 参数: string basePath 基地址
// 参数: vector<string> & trainImageList 图像路径list
// 参数: vector<int> & trainLabelList 图像标签list
//***************************************************************
void readTrainFileList(string trainImageFile, string basePath, vector<string> &trainImageList, vector<int> &trainLabelList)
{
ifstream readData( trainImageFile );
string buffer;
while( readData )
{
if( getline( readData, buffer))
{
int label = int((buffer[0])-'0');//在我这里路径中第一个文件夹就是类别
trainLabelList.push_back( label);
trainImageList.push_back( buffer );//图像路径
}
}
readData.close();
cout<<"Read Train Data Complete"<<endl;
}
//***************************************************************
// 名称: readTestFileList
// 功能: 读测试文件
// 权限: public
// 返回值: void
// 参数: string testImageFile
// 参数: string basePath
// 参数: vector<string> & testImageList 测试图像列表
//***************************************************************
void readTestFileList(string testImageFile, string basePath, vector<string> &testImageList)
{
ifstream readData( testImageFile ); //加载测试图片集合
string buffer;
while( readData )
{
if( getline( readData, buffer))
{
testImageList.push_back( buffer );//图像路径
}
}
readData.close();
cout<<"Read Test Data Complete"<<endl;
}
//***************************************************************
// 名称: processHogFeature
// 功能: 计算Hog特征
// 权限: public
// 返回值: void
// 参数: vector<string> trainImageList
// 参数: vector<int> trainLabelList
// 参数: CvMat * & dataMat
// 参数: CvMat * & labelMat
//***************************************************************
void processHogFeature(vector<string> trainImageList,vector<int> trainLabelList, CvMat * &dataMat,CvMat * &labelMat)
{
int trainSampleNum = trainImageList.size();
dataMat = cvCreateMat( trainSampleNum, 324, CV_32FC1 ); //324为Hog feature Size
cvSetZero( dataMat );
labelMat = cvCreateMat( trainSampleNum, 1, CV_32FC1 );
cvSetZero( labelMat );
IplImage* src;
IplImage* trainImg=cvCreateImage(cvSize(20,20),8,3);//20 20
for( int i = 0; i != trainImageList.size(); i++ )
{
src=cvLoadImage( (trainBasePath + trainImageList[i]).c_str(),1);
if( src == NULL )
{
cout<<" can not load the image: "<<(trainBasePath + trainImageList[i]).c_str()<<endl;
continue;
}
//cout<<"Calculate Hog Feature "<<(trainBasePath + trainImageList[i]).c_str()<<endl;
cvResize(src,trainImg);
HOGDescriptor *hog=new HOGDescriptor(cvSize(20,20),cvSize(10,10),cvSize(5,5),cvSize(5,5),9);
vector<float>descriptors;
hog->compute(trainImg, descriptors,Size(1,1), Size(0,0));
int j =0;
for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)
{
cvmSet(dataMat,i,j,*iter);//存储HOG特征
j++;
}
cvmSet( labelMat, i, 0, trainLabelList[i] );
//cout<<"Image and label "<<trainImageList[i].c_str()<<" "<<trainLabelList[i]<<endl;
}
cout<<"Calculate Hog Feature Complete"<<endl;
cout<<dataMat<<endl;
}
void processNonFeature(vector<string> trainImageList,vector<int> trainLabelList, CvMat * &dataMat,CvMat * &labelMat)
{
int trainSampleNum = trainImageList.size();
dataMat = cvCreateMat( trainSampleNum, 400, CV_32FC1 ); //324为Hog feature 大小,需提前设置
cvSetZero( dataMat );
labelMat = cvCreateMat( trainSampleNum, 1, CV_32FC1 );
cvSetZero( labelMat );
IplImage* src;
IplImage* resizeImg=cvCreateImage(cvSize(20,20),8,3);//20 20是训练样本的大小
for( int i = 0; i != trainImageList.size(); i++ )
{
src=cvLoadImage( (trainBasePath + trainImageList[i]).c_str(),1);
if( src == NULL )
{
cout<<" can not load the image: "<<(trainBasePath + trainImageList[i]).c_str()<<endl;
continue;
}
//cout<<"Calculate Hog Feature "<<(trainBasePath + trainImageList[i]).c_str()<<endl;
cvResize(src,resizeImg);
IplImage * grayImage = cvCreateImage(cvGetSize(resizeImg), IPL_DEPTH_8U, 1);
cvCvtColor(resizeImg,grayImage,CV_BGR2GRAY);
//二值化图像
IplImage * binaryImage = cvCreateImage(cvGetSize(grayImage),IPL_DEPTH_8U,1);
cvThreshold(grayImage,binaryImage,25,255,CV_THRESH_BINARY);
//cvNamedWindow("src");
//cvShowImage("src", src);
//cvNamedWindow("show");
//cvShowImage("show", binaryImage);
//cvWaitKey(0);//这里是看一下二值化的效果怎么样
HOGDescriptor *hog=new HOGDescriptor(cvSize(20,20),cvSize(10,10),cvSize(5,5),cvSize(5,5),9);
vector<float>descriptors;
int j =0; //j为矩阵的水平坐标,要把特征从vector中拷贝过来
uchar * tmp = new uchar;
for(int n=0;n<binaryImage->height;n++)
{ for(int m=0;m<binaryImage->width;m++)
{
*tmp=((uchar *)(binaryImage->imageData + n*binaryImage->widthStep))[m];
cvmSet(dataMat,i,j,*tmp);//存储HOG特征
j++;
}
}
cvmSet( labelMat, i, 0, trainLabelList[i] );
//cout<<"Image and label "<<trainImageList[i].c_str()<<" "<<trainLabelList[i]<<endl;
}
cout<<"Calculate Hog Feature Complete"<<endl;
}
//***************************************************************
// 名称: trainSVM
// 功能: 此处用的是opencv的SVM训练
// 权限: public
// 返回值: void
// 参数: CvMat * & dataMat
// 参数: CvMat * & labelMat
//***************************************************************
void trainSVM(CvMat * & dataMat,CvMat * & labelMat )
{
cout<<"train svm start"<<endl;
cout<<dataMat<<endl;
CvSVM svm;
CvSVMParams param;//这里是SVM训练相关参数
CvTermCriteria criteria;
criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );
param = CvSVMParams( CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );
svm.train( dataMat, labelMat, NULL, NULL, param );//训练数据
svm.save( SVMModel.c_str());
cout<<"SVM Training Complete"<<endl;
}
//***************************************************************
// 名称: trainLibSVM
// 功能: 此处用的是LibSVM库的SVM训练
// 权限: public
// 返回值: void
// 参数: CvMat * & dataMat
// 参数: CvMat * & labelMat
//***************************************************************
void trainLibSVM(CvMat *& dataMat, CvMat * & labelMat)
{
cout<<"LibSVM start"<<endl;
//配置SVM参数
svm_parameter param;
//param.svm_type = C_SVC;
param.svm_type = EPSILON_SVR;
param.kernel_type = RBF;
param.degree = 10.0;
param.gamma = 0.09;
param.coef0 = 1.0;
param.nu = 0.5;
param.cache_size = 1000;
param.C = 10.0;
param.eps = 1e-3;
param.p = 1.0;
//svm_prob读取
svm_problem svm_prob;
int sampleNum = dataMat->rows;
int vectorLength = dataMat->cols;
svm_prob.l = sampleNum;
svm_prob.y = new double [sampleNum];
for (int i = 0; i < sampleNum; i++)
{
svm_prob.y[i] = cvmGet(labelMat,i,0);
}
cout<<"LibSVM middle"<<endl;
svm_prob.x = new svm_node * [sampleNum];
for (int i = 0; i < sampleNum; i++)
{
svm_node * x_space = new svm_node [vectorLength + 1];
for (int j = 0; j < vectorLength; j++)
{
x_space[j].index = j;
x_space[j].value = cvmGet(dataMat,i,j);
}
x_space[vectorLength].index = -1;//注意,结束符号,一开始忘记加了
svm_prob.x[i] = x_space;
}
cout<<"LibSVM end"<<endl;
svm_model * svm_model = svm_train(&svm_prob, ¶m);
#ifdef srcfeature
svm_save_model("libsvm_minist_src_feature_model_.model",svm_model);
#else
svm_save_model("libsvm_minist_model.model",svm_model);
#endif
for (int i=0 ; i < sampleNum; i++)
{
delete [] svm_prob.x[i];
}
delete [] svm_prob.y;
svm_free_model_content(svm_model);
}
//***************************************************************
// 名称: testSVM
// 功能: 测试opencv训练的SVM准确率
// 权限: public
// 返回值: void
// 参数: vector<string> testImageList
// 参数: string SVMModel
//***************************************************************
void testSVM(vector<string> testImageList, string SVMModel)
{
CvSVM svm;
svm.load(SVMModel.c_str());//加载模型文件
IplImage* testImage;
IplImage* tempImage;
char buffer[512];
ofstream ResultOutput( "predict_result.txt" );//把预测结果存储在这个文本中
for( int j = 0; j != testImageList.size(); j++ )//依次遍历所有的待检测图片
{
testImage = cvLoadImage( (testBasePath+testImageList[j]).c_str(), 1);
if( testImage == NULL )
{
cout<<" can not load the image: "<<(testBasePath+testImageList[j]).c_str()<<endl;
continue;
}
tempImage =cvCreateImage(cvSize(20,20),8,3);
cvZero(tempImage);
cvResize(testImage,tempImage);
HOGDescriptor *hog=new HOGDescriptor(cvSize(20,20),cvSize(10,10),cvSize(5,5),cvSize(5,5),9);
vector<float>descriptors;
hog->compute(tempImage, descriptors,Size(1,1), Size(0,0));
CvMat* TempMat=cvCreateMat(1,descriptors.size(),CV_32FC1);
int n=0;
for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)
{
cvmSet(TempMat,0,n,*iter);
n++;
}
int resultLabel = svm.predict(TempMat);//检测结果
sprintf( buffer, "%s %d\r\n",testImageList[j].c_str(),resultLabel );
ResultOutput<<buffer;
}
cvReleaseImage(&testImage);
cvReleaseImage(&tempImage);
ResultOutput.close();
cout<<"SVM Predict Complete"<<endl;
}
//***************************************************************
// 名称: testLibSVM
// 功能: 测试LisbSVM训练的模型的分类性能
// 权限: public
// 返回值: void
// 参数: string LibSVMModelFile
// 参数: vector<string> testImageList
// 参数: string SVMModel
//***************************************************************
void testLibSVM(string LibSVMModelFile, vector<string> testImageList, string SVMModel)
{
svm_model * svm = svm_load_model(LibSVMModelFile.c_str());
IplImage* testImage;
IplImage* tempImage;
char buffer[512];
ofstream ResultOutput( "libsvm_predict_result.txt" );
for( int j = 0; j != testImageList.size(); j++ )//依次遍历所有的待检测图片
{
testImage = cvLoadImage( (testBasePath+testImageList[j]).c_str(), 1);
if( testImage == NULL )
{
cout<<" can not load the image: "<<(testBasePath+testImageList[j]).c_str()<<endl;
continue;
}
tempImage =cvCreateImage(cvSize(20,20),8,3);
cvZero(tempImage);
cvResize(testImage,tempImage);
HOGDescriptor *hog=new HOGDescriptor(cvSize(20,20),cvSize(10,10),cvSize(5,5),cvSize(5,5),9);
vector<float>descriptors;
hog->compute(tempImage, descriptors,Size(1,1), Size(0,0));
svm_node * inputVector = new svm_node [ descriptors.size()+1];
int n = 0;
for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)
{
inputVector[n].index = n;
inputVector[n].value = *iter;
n++;
}
inputVector[n].index = -1;
int resultLabel = svm_predict(svm,inputVector);//分类结果
sprintf( buffer, "%s %d\r\n",testImageList[j].c_str(),resultLabel );
ResultOutput<<buffer;
delete [] inputVector;
}
svm_free_model_content(svm);
cvReleaseImage(&testImage);
cvReleaseImage(&tempImage);
ResultOutput.close();
cout<<"SVM Predict Complete"<<endl;
}
//***************************************************************
// 名称: releaseAll
// 功能: 释放相应的资源
// 权限: public
// 返回值: void
//***************************************************************
void releaseAll()
{
cvReleaseMat( &dataMat );
cvReleaseMat( &labelMat);
cout<<"Release All Complete"<<endl;
}
//***************************************************************
// 名称: main
// 功能: 这里用了两种SVM,一种是opencv中的,一种是libsvm中的,训练测试需要选择相对应的svm
// 权限: public
// 返回值: int
//***************************************************************
int main()
{
readTrainFileList(trainImageFile,trainBasePath,trainImageList,trainLabelList);
processHogFeature(trainImageList,trainLabelList, dataMat,labelMat);
//trainSVM(dataMat,labelMat );
//processNonFeature(trainImageList,trainLabelList, dataMat,labelMat);
trainLibSVM(dataMat,labelMat);
//readTestFileList( testImageFile, testBasePath, testImageList);
testLibSVM("libsvm_minist_model.model",testImageList,SVMModel);
//testSVM( testImageList, SVMModel);
releaseAll();
return 0;
}
libsvm Minist Hog 手写体识别(源码文件)的更多相关文章
- libsvm Minist Hog 手写体识别
统计手写数字集的HOG特征 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ 这篇文章是模式识别的小作业,利用sv ...
- [C/C++] 各种C/C++编译器对UTF-8源码文件的兼容性测试(VC、GCC、BCB)
在不同平台上开发C/C++程序时,为了避免源码文件乱码,得采用UTF-8编码来存储源码文件.但是很多编译器对UTF-8源码文件兼容性不佳,于是我做了一些测试,分析了最佳保存方案. 一.测试程序 为了测 ...
- 《UNIX网络编程(第3版)》unp.h等源码文件的编译安装
操作系统:Mac OS X 10.11.5 1.下载书中的源代码:点击下载 2.切换到解压后的目录 unpv13e,先查看下 README,依次执行: ./configure cd lib make ...
- Erlang千万级用户游戏框架(Openpoker)源码文件分析清单
openpoker源码 erlang写的网游服务器源码,OpenPoker是一个大型多人扑克网游,内建支持了容错能力,负载平衡和无限制的规模大小.本文是openpoker源码文件功能的一个清单式说明: ...
- C++ 多源码文件简单组织
C++ 多源码文件简单组织 基本上和C的是一样的,只不过C++的方法要在类中声明.看一个简单实例.ainimal.h 类里面对外公开的信息. 点击(此处)折叠或打开 #ifndef _ANIMAL_ ...
- Python源码文件中带有中文时,输出乱码
Python源码文件中带有中文时,文件头应加注释: #!/usr/bin/env python # -*- coding: utf-8 -*- 第一行注释是为了告诉Linux/OS X系统,这是一个P ...
- 对threading模块源码文件的解读(不全)
# -*- coding: utf-8 -*- #python 27 #xiaodeng #对threading模块源码文件的解读(不全) import threading #类 #Thread() ...
- TFS二次开发-基线文件管理器(5)-源码文件的读取
在上一节中,我们在保存标签之前,已经将勾选的文件路径保存到了Listbox中,这里只需要将保存的数据输出去为txt文档就可以做版本控制了. 版本文件比较复杂的是如何读取,也就是如何通过文件路径 ...
- go语言的源码文件的分类及含义
Go源码文件:名称以.go为后缀,内容以Go语言代码组织的文件 多个Go源码文件是需要用代码包组织起来的 源码文件分为三类:命令源码文件.库源码文件(go语言程序) 测试源码文件(辅助源码文件) 命令 ...
随机推荐
- 唯美!分享8款响应式的 WordPress 餐厅主题
您是否拥有一个餐厅,酒吧,咖啡馆,小酒馆,比萨饼店?如果答案是肯定的,请确保您在网上也提供服务.为了使您的工作更轻松,我们选择了一些新的和独特的餐厅主题,覆盖了范围很广的食品企业.这些主题提供了很多很 ...
- 站长必备:10个好用的 WordPress 备份插件
网站备份对于站长来说极其重要的.任何的事情都可能发生,这可能会导致你失去所有的辛勤工作:您的网站可能被黑客攻破,你可以安装一个了插件导致冲突,你的服务器可能被攻击,你可能在编辑文件时犯了一个错误等等, ...
- 实现a标签中的各种点击(onclick)事件的方法
我们常用的在a标签中有点击事件:1. a href="javascript:js_method();"这是我们平台上常用的方法,但是这种方法在传递this等参数的时候很容易出问题, ...
- Win10中安装ArcObject帮助
问题 环境:Win10+VS2010+ArcGIS10.0,未能成功安装其AO帮助文档:使用help library manager手动安装也报错. 选择msha文件: 解决 查看系统事件,发现组件注 ...
- sharepoint2010问卷调查(1)-实现问卷的图片调查(采用JS实现)
1. 首先建立个图片库上传图片 2. 采用:评估范围(一系列选项或 Likert 范围)制作,如下图: http://win-i07fillcfom:8003/DocLib2/1.jpg http ...
- MSCRM 2013/2015 Ribbon Editor
由于新版本2015的解决方案与之前有变化,因此许多老的Tools已经不能使用,推荐给大家新的Ribbon Editor Tool. 下载地址: http://www.develop1.net/publ ...
- JAVA Web 实现会话跟踪的技术笔记
1.HTTP协议无状态:客户端的请求与服务器的响应所发生的一系列行为简单的说是客户发送了请求,服务器就给客户端响应,它们彼此之间都没有记录下来.如: 顾客与自动售货机 普通顾客(非会员)与商场 2.c ...
- tomcat部署java servlet的3种方式
1.将编译好的class文件按照与工程中的package的目录结构一致的文件夹底下 2.将你的servlet封装成 .war(web application archive格式的后缀名) 格式的文档直 ...
- Android touch mode和focusableInTouchMode分析
首先我们来看看touch mode的定义.它是用户和手机进行交互时view层次结构的一个状态.它本身是很容易理解的, 代表了最近一次的交互是否是通过触摸屏发生的,因为在Android设备上还存在别的交 ...
- js中转换Date日期格式
在javascript中直接输出Date得到的结果是这样的: function date(){ var date = new Date(); alert(date); } 结果是:Mon Jun 15 ...