OpenCV：使用OpenCV3随机森林进行统计特征多类分析

本文贴出的代码为自己的训练集所用，作为参考。可运行demo程序请拜访原作者。

CNN作为图像识别和检测器，在分析物体结构分布的多类识别中具有绝对的优势。通多多层卷积核Pooling实现对物体表面分布的模板学习，以卷积核的形式存储在网络中。而对于统计特征，暂时没有明确的指导规则。

opencv3中的ml类与opencv2中发生了变化，下面列举opencv3的机器学习类方法实例，以随机森林为例。

代码：

	//使用OpenCV随机森林训练模型//使用训练好的样本-TXT文件

	int RTreesTrain( int argc, char* argv[] )

	{

		if (argc < 9) {

			std::cout << "argc<9";

			return 0;

		}

		std::string fileFeatureTrain(argv[1]);

		std::string  fileFeatureTest(argv[2]);

		std::string        fileTrees(argv[3]);

		int lenF   = atoi(argv[4]);//特征长度 32

		int numF = atoi(argv[5]);//使用特征个数 1000

		int nsample = atoi(argv[6]);//总样本数 大于numF

		int nTrees = atoi(argv[7]);

		int nClass = atoi(argv[8]);

		//载入特征

		cv::Mat data;

		cv::Mat responses;

		const string data_filename = fileFeatureTrain;

		read_num_class_data( data_filename, numF, lenF, &data, &responses );

		cv::Ptr<cv::ml::RTrees>  StyleModelHSV;

		StyleModelHSV = cv::ml::RTrees::create();

		StyleModelHSV->setMaxDepth(10);

		StyleModelHSV->setMinSampleCount(10);

		StyleModelHSV->setRegressionAccuracy(0);

		StyleModelHSV->setUseSurrogates(false);

		StyleModelHSV->setMaxCategories(nClass);

		StyleModelHSV->setPriors(cv::Mat());

		StyleModelHSV->setCalculateVarImportance(true);

		StyleModelHSV->setActiveVarCount(4);

		StyleModelHSV->setTermCriteria(TC(10000, 0.01f));

		int nsamples_all = nsample;// data.rows;

		int ntrain_samples = numF;// (int)(nsamples_all*0.8);

		cv::Ptr<cv::ml::TrainData> tdata = prepare_train_data(data, responses, ntrain_samples);

		cout << "The Model is training....." << endl;

		StyleModelHSV->train(tdata);

		StyleModelHSV->save(fileTrees);

		return 1;

	}

	// 读取文件数据

	bool read_num_class_data( const string& fileFeatureTrain, int numF,int fLen, cv::Mat* _data, cv::Mat* _responses)

	{

		using namespace cv;

		Mat el_ptr(1, numF, CV_32F);

		vector<int>  responses(0);

		_data->release();

		_responses->release();

		freopen(fileFeatureTrain.c_str(), "r", stdin);

		cout << "The feature is loading....." << endl;

		int i = 0;

		int label = 0;

		for (int i = 0; i < numF; ++i) {

			StyleFeature  aFeat;aFeat.second.resize(fLen);

			std::string sline;getline(cin, sline);

			//以空格分开

			int idxBlank = sline.find_first_of(" ");

			std::string sLabel = sline;//获取标签；

			sLabel.erase(idxBlank, sLabel.length());

			responses.push_back(label);//aFeat.first = label = atoi(sLabel.c_str());

			std::string sFV = sline;

			sFV.erase(0, idxBlank + 1);//获取一行，特征

			int idxFv = 0;

			float fV = 0.0;

			while (sFV.length() > 0 && idxFv < fLen) {

				int idxColon = sFV.find_first_of(":");

				std::string sv = sFV;

				std::strstream ssv;

				sv = sv.substr(idxColon + 1, sv.find_first_of(" ") - 2);

				ssv << sv;ssv >> fV;

				el_ptr.at<float>(i) = fV;//aFeat.second[idxFv] = fV;

				++idxFv;

				sFV.erase(0, sFV.find_first_of(" ") + 1);

			}

			_data->push_back(el_ptr);//trainData.push_back(aFeat);

		}

		fclose(stdin); cout << "The feature load over....." << endl;

		Mat(responses).copyTo(*_responses);

		return true;

	}

	//准备训练数据

	cv::Ptr<cv::ml::TrainData> prepare_train_data( const cv::Mat& data, const cv::Mat& responses, int ntrain_samples )

	{

		using namespace cv;

		Mat sample_idx = Mat::zeros(1, data.rows, CV_8U);

		Mat train_samples = sample_idx.colRange(0, ntrain_samples);

		train_samples.setTo(Scalar::all(1));

		int nvars = data.cols;

		Mat var_type(nvars + 1, 1, CV_8U);

		var_type.setTo(Scalar::all(ml::VAR_ORDERED));

		var_type.at<uchar>(nvars) = ml::VAR_CATEGORICAL;

		return ml::TrainData::create(data, ml::ROW_SAMPLE, responses, noArray(), sample_idx, noArray(), var_type);

	}

样本结构：

0 1:211946 2:0 3:0 4:0 5:105 6:5693 7:34 8:0 9:0 10:0 11:25 12:12697 13:226916 14:1826 15:497 16:282 17:105 18:15 19:104 20:18 21:0 22:737 23:46979 24:17889 25:7121 26:6970 27:9441 28:12679 29:20890 30:37498 31:43568 32:27465

0 1:23544 2:210 3:11663 4:158 5:310 6:166 7:591 8:6131 9:193297 10:1985 11:1136 12:809 13:149069 14:33036 15:20045 16:11525 17:6552 18:2928 19:2590 20:1844 21:1305 22:11106 23:81817 24:29063 25:6654 26:5015 27:4916 28:8862 29:34762 30:44044 31:17409 32:7458

0 1:254596 2:0 3:65361 4:0 5:0 6:0 7:0 8:0 9:0 10:0 11:10 12:14033 13:333347 14:330 15:75 16:80 17:25 18:0 19:42 20:0 21:0 22:101 23:31990 24:66583 25:49191 26:59149 27:35800 28:25089 29:21463 30:18022 31:18409 32:8304

0 1:11697 2:2431 3:228 4:9 5:0 6:1 7:150 8:28 9:8413 10:9673 11:6345 12:6025 13:7695 14:8080 15:5689 16:6175 17:5146 18:4358 19:3246 20:2170 21:1478 22:963 23:2192 24:6866 25:7082 26:4273 27:3100 28:2733 29:2833 30:3265 31:3835 32:8821

OpenCV：使用OpenCV3随机森林进行统计特征多类分析的更多相关文章

基于opencv的RandomForest随机森林
2.OpenCV函数使用 OpenCV提供了随机森林的相关类和函数.具体使用方法如下: (1)首先利用CvRTParams定义自己的参数,其格式如下 CvRTParams::CvRTParams(in ...
OpenCV：使用随机森林与GBDT
随机森林顾名思义,是用随机的方式建立一个森林.简单来说,随机森林就是由多棵CART(Classification And Regression Tree)构成的.对于每棵树,它们使用的训练集是从总的训 ...
RandomForestClassifier(随机森林检测每个特征的重要性及每个样例属于哪个类的概率)
#In the next recipe, we'll look at how to tune the random forest classifier. #Let's start by importi ...
随机森林算法原理及OpenCV应用
随机森林算法是机器学习.计算机视觉等领域内应用较为广泛的一个算法.它不仅可以用来做分类(包括二分类和多分类),也可用来做回归预测,也可以作为一种数据降维的手段. 在随机森林中,将生成很多的决策树,并不 ...
用随机森林分类器和GBDT进行特征筛选
一.决策树(类型.节点特征选择的算法原理.优缺点.随机森林算法产生的背景) 1.分类树和回归树由目标变量是离散的还是连续的来决定的:目标变量是离散的,选择分类树:反之(目标变量是连续的,但自变量可以 ...
ObjectT5：在线随机森林-Multi-Forest-A chameleon in track in
原文::Multi-Forest:A chameleon in tracking,CVPR2014 下的蛋...原文使用随机森林的优势,在于可以使用GPU把每棵树分到一个流处理器里运行,容易并行化 ...
RandomForest随机森林总结
1.随机森林原理介绍随机森林,指的是利用多棵树对样本进行训练并预测的一种分类器.该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标.简单来说,随机森林就是由多棵CA ...
CART决策树和随机森林
CART 分裂规则将现有节点的数据分裂成两个子集,计算每个子集的gini index 子集的Gini index: \(gini_{child}=\sum_{i=1}^K p_{ti} \sum_{ ...
Python中随机森林的实现与解释
使用像Scikit-Learn这样的库,现在很容易在Python中实现数百种机器学习算法.这很容易,我们通常不需要任何关于模型如何工作的潜在知识来使用它.虽然不需要了解所有细节,但了解机器学习模型是如 ...

随机推荐

DATASNAP压缩过滤器的使用
ZLIBCOMPRESSION FILTER 作为范例,我们使用已随D2010提供的DataSnap过滤器.可用于在客户端和服务端压缩数据流.这里说的ZlibCompression过滤器可以在DbxC ...
移动智能设备功耗优化系列--前言（NVIDIA资深project师分享）
本文是嵌入式企鹅圈原创团队成员.NVIDIA资深开发project师Terry发表的第一篇文章,其将对"移动智能设备功耗优化"这个专题展开一个系列的总结分享. Terry毫无保留地 ...
【CV论文阅读】YOLO：Unified, Real-Time Object Detection
YOLO的一大特点就是快,在处理上可以达到完全的实时.原因在于它整个检测方法非常的简洁,使用回归的方法,直接在原图上进行目标检测与定位. 多任务检测: 网络把目标检测与定位统一到一个深度网络中,而且可 ...
C++学习之动态数组类的封装
动态数组(Dynamic Array)是指动态分配的.可以根据需求动态增长占用内存的数组.为了实现一个动态数组类的封装,我们需要考虑几个问题:new/delete的使用.内存分配策略.类的四大函数(构 ...
javascript 数组总结
数组的创建: 数组可以使用Array构造函数来创建,或者使用[]快速创建. 1. Array构造函数创建数组: 无参数,创建空数组: var arry = new Array(); 参数为一个数字,指 ...
Hibernate基于注解的双向one-to-many映射关系的实现
在项目中用到了一对多的实体类关系映射,之前接触的都是基于配置文件的映射实现.可是公司的大部分都是基于注解的.因此自己參考之前的代码捣鼓了基于注解的一对多的映射关系实现. 背景: 一的一端:QingAo ...
分布式数据库中间件DDM的实现原理
随着数据量不断增大,传统的架构模式难以解决业务量不断增长所带来的问题,特别是在业务成线性.甚至指数级上升的情况.此时我们不得不通过水平扩展,把数据库放到不同服务器上来解决问题,也就是我们说的数据库中间 ...
maven使用（转载）
一.安装配置: 1.安装配置JDK java/javac -version 2.安装配置maven mvn -v 3.下载项目模板 mvn archetype:generate 二.详 ...
ios8--加载图片
// // ViewController.m // 06-资源存放问题 #import "ViewController.h" /** 加载图片的方式: 1. imageNamed: ...
51nod 1611 金牌赛事
被亮亮D飞啦!!QWQ 这题明明是最大权闭合子图+线段树优化构图好不好被迫考虑DP,并且考虑f[i]表示到第i个位置的最大值(第i个位置可选可不选) 对于最终的答案,我们可以分割成一段一段的,也就是 ...

OpenCV：使用OpenCV3随机森林进行统计特征多类分析

OpenCV：使用OpenCV3随机森林进行统计特征多类分析的更多相关文章

随机推荐

热门专题