前言

级联分类器的效果并不是很好，准确度相对深度学习较低，上一章节使用了dnn中的tensorflow，本章使用yolov3模型，识别出具体的分类。

Demo

320x320，置信度0.6

608x608，置信度0.6（.cfg里面是608）

yolov3模型下载

coco.names：模型具体的分类信息。
https://github.com/pjreddie/darknet/blob/master/data/coco.names
yolov3.weights：权重文件
https://pjreddie.com/media/files/yolov3.weights
yolov3.cfg：配置文件
https://github.com/pjreddie/darknet/blob/master/cfg/yolov3.cfg
以上若是下载不下来，提供其他下载地址，因为github非常慢。

CSDN：https://download.csdn.net/download/qq21497936/12995972

OpenCV深度识别基本流程

opencv3.4.x支持了各种模型。

支持的模型

opencv3.4.x支持一下深度学习的模型：
- caffe：.caffemodel
官网：http://caffe.berkeleyvision.org
- tensorflow：.pb
官网：https://www.tensorflow.org
- torch：.t7 | .net
官网：http://torch.ch
- darknet：.weights
官网：https://pjreddie.com/darknet
- DLDT：.bin
官网：https://software.intel.com/openvino-toolkit

操作步骤：yolov3

不同深度学习框架产生的模型，在操作上和数据输出上有一些区别。梳理下opencv使用tensorflow训练好的模型的使用步骤。

步骤一：读取分类文件

模型文件对应了不同的分类文件，分类文件是以行为标识，所在的行数（0开始），就是最终识别出的分类号的第几个分类。

std::string classesFile = "E:/qtProject/openCVDemo/dnnData/" \

                    "yolov3/coco.names";

// 读入分类名称，存入缓存

std::ifstream ifs(classesFile);

std::vector<std::string> classes;

std::string classLine;

while(std::getline(ifs, classLine))

{

    classes.push_back(classLine);

}

步骤二：加载模型和配置文件，建立神经网络。

根据不同的模型，使用cv::dnn::readNetFromXXX系列函数进行读取，opencv3.4.x系列支持的dnn模型（支持模型往上看）。
yolov3模型如下：

std::string modelWeights = "E:/qtProject/openCVDemo/dnnData/" \

                       "yolov3/yolov3.weights";

std::string modelCfg = "E:/qtProject/openCVDemo/dnnData/" \

                       "yolov3/yolov3.cfg";

// 加载yolov3模型

cv::dnn::Net net = cv::dnn::readNetFromDarknet(modelCfg, modelWeights);

if(net.empty())

{

    qDebug() << __FILE__ << __LINE__ << "net is empty!!!";

    return;

}

步骤三：将要预测的图片加入到神经网络中

加入之后，需要识别图片，那么需要把图片输入到神经网络当中去，使用yolov3模型特别注意，要先进行归一化，然后变成指定大小的图片，如下：

// 读取图片识别

mat = cv::imread("E:/testFile/15.jpg");

if(!mat.data)

{

    qDebug() << __FILE__ << __LINE__ << "Failed to read image!!!";

    return;

}

//    cv::dnn::blobFromImage(mat, blob);

//  必须要设置，否则会跑飞

cv::dnn::blobFromImage(mat,

                     blob,

                     1.0f/255,

                     cv::Size(320, 320),

                     cv::Scalar(0, 0, 0),

                     true,

                     false);

net.setInput(blob);

宽度高度增加可以提升检测的准确度，最好是根据cfg文件进行修改，本Demo是320x320，实际.cfg文件中的是608x608，并且经过测试，这个是识别效果最好的像素，大于608则会跑飞。

步骤四：分类预测，获取识别的结果

输入之后，就进行识别，识别是向前预测（分类预测），并且拿到结果，对于yolov3模型，规定了有3个输出层，所以需要先获取3个输出层，然后预测的时候就需要指定预测这3个输出层，否则会跑飞。

// 获取输出的层

std::vector<cv::String> outPutNames;

std::vector<int> outLayers = net.getUnconnectedOutLayers();

for(int index = 0; index < outLayers.size(); index++)

{

    outPutNames.push_back(layerNames[outLayers[index] - 1]);

    qDebug() << __FILE__ << __LINE__

    << QString(layerNames[outLayers[index] - 1].c_str());

}

// 推理预测：可以输入预测的图层名称

std::vector<cv::Mat> probs;

net.forward(probs, outPutNames);

对于预测的结果，存于std::vectorcv::Mat类型的probs，每一个元素指定为cv::Mat类型的prob，每一行代表一个检测到的分类，具体列信息如下表：

（注意：具体的使用，请参照“步骤五”）

步骤五：对达到置信度的可以通过输出的mat进行分类和框选

关键的输出结果步骤，不同的识别有区别，yolov3如下图：

// 置信度预制，大于执行度的将其使用rect框出来

for(int index = 0; index < probs.size(); index++)

{

    for (int row = 0; row < probs[index].rows; row++)

    {

        // 获取probs中一个元素里面匹配对的所有对象中得分最高的

        cv::Mat scores = probs[index].row(row).colRange(5, probs[index].cols);

        cv::Point classIdPoint;

        double confidence;

        // Get the value and location of the maximum score

        cv::minMaxLoc(scores, 0, &confidence, 0, &classIdPoint);

        if(confidence > 0.6)

        {

            qDebug() << __FILE__ << __LINE__ << confidence << classIdPoint.x;

            int centerX = (int)(probs.at(index).at<float>(row, 0) * mat.cols);

            int centerY = (int)(probs.at(index).at<float>(row, 1) * mat.rows);

            int width   = (int)(probs.at(index).at<float>(row, 2) * mat.cols);

            int height  = (int)(probs.at(index).at<float>(row, 3) * mat.rows);

            int left = centerX - width / 2;

            int top = centerY - height / 2;

            cv::Rect objectRect(left, top, width, height);

            cv::rectangle(mat, objectRect, cv::Scalar(255, 0, 0), 2);

            cv::String label = cv::format("%s:%.4f",

                                          classes[classIdPoint.x].data(),

                                          confidence);

            cv::putText(mat,

                        label,

                        cv::Point(left, top - 10),

                        cv::FONT_HERSHEY_SIMPLEX,

                        0.4,

                        cv::Scalar(0, 0, 255));

            qDebug() << __FILE__ << __LINE__

                    << centerX << centerY << width << height;

        }

    }

}

函数原型

读取yolov3模型与配置文件函数原型

Net readNetFromDarknet(const String &cfgFile,

                      const String &darknetModel = String());

从文件中读取。

参数一：带有网络体系结构文本描述的.cfg文件的路径；
参数二：已学习网络的.weights文件的路径；

读取图片（需要识别的）函数原型

void blobFromImage(InputArray image,

                  OutputArray blob,

                  double scalefactor=1.0,

                  const Size& size = Size(),

                  const Scalar& mean = Scalar(),

                  bool swapRB=false,

                  bool crop=false,

                  int ddepth=CV_32F);.

从图像创建区域。可选择从中心调整和裁剪图像。

参数一：图像输入图像（1、3或4通道）；
参数二：输出的图像空间；
参数三：图像值的缩放因子乘数；
参数四：大小输出图像的空间大小；
参数五：从通道中减去平均值的平均标量。价值是有意的，如果image有BGR顺序，swapRB为真，则按（mean-R，mean-G，mean-B）顺序排列；
参数六：swapRB标志，指示交换第一个和最后一个通道，在三通道图像是必要的；
参数七：裁剪标志，指示调整大小后是否裁剪图像；
参数八：输出blob的深度，选择CV_32F或CV_8U；

设置神经网络输入函数原型

void cv::dnn::Net::setInput(InputArray blob,

                      const String& name = "",

                      double scalefactor = 1.0,

                      const Scalar& mean = Scalar());

设置网络的新输入值。

参数一：一个新的blob。应具有CV_32F或CV_8U深度。
参数二：输入层的名称。
参数三：可选的标准化刻度。
参数四：可选的平均减去值。

返回所有层的名称（按照本身的索引循序排列）

std::vector<String> getLayerNames() const;

返回具有未连接输出的层的索引。

std::vector<int> getUnconnectedOutLayers() const;

深度检测识别（向前预测）函数原型

void cv::dnn::Net::Mat forward(const String& outputName = String());

向前预测，返回指定层的第一个输出的blob，一般是返回最后一层，可使用cv::Net::getLayarNames()获取所有的层名称。

参数一：outputName需要获取输出的层的名称

Demo

void OpenCVManager::testYoloV3()

{

    std::string classesFile = "E:/qtProject/openCVDemo/dnnData/" \

                              "yolov3/coco.names";

    std::string modelWeights = "E:/qtProject/openCVDemo/dnnData/" \

                          "yolov3/yolov3.weights";

    std::string modelCfg = "E:/qtProject/openCVDemo/dnnData/" \

                           "yolov3/yolov3.cfg";

    // 读入分类名称，存入缓存

    std::ifstream ifs(classesFile);

    std::vector<std::string> classes;

    std::string classLine;

    while(std::getline(ifs, classLine))

    {

        classes.push_back(classLine);

    }

    // 加载yolov3模型

    cv::dnn::Net net = cv::dnn::readNetFromDarknet(modelCfg, modelWeights);

    if(net.empty())

    {

        qDebug() << __FILE__ << __LINE__ << "net is empty!!!";

        return;

    }

    cv::Mat mat;

    cv::Mat blob;

    // 获得所有层的名称和索引

    std::vector<cv::String> layerNames = net.getLayerNames();

    int lastLayerId = net.getLayerId(layerNames[layerNames.size() - 1]);

    cv::Ptr<cv::dnn::Layer> lastLayer = net.getLayer(cv::dnn::DictValue(lastLayerId));

    qDebug() << __FILE__ << __LINE__

             << QString(lastLayer->type.c_str())

             << QString(lastLayer->getDefaultName().c_str())

             << QString(layerNames[layerNames.size()-1].c_str());

    // 获取输出的层

    std::vector<cv::String> outPutNames;

    std::vector<int> outLayers = net.getUnconnectedOutLayers();

    for(int index = 0; index < outLayers.size(); index++)

    {

        outPutNames.push_back(layerNames[outLayers[index] - 1]);

        qDebug() << __FILE__ << __LINE__

                 << QString(layerNames[outLayers[index] - 1].c_str());

    }

    while(true)

    {

        // 读取图片识别

        mat = cv::imread("E:/testFile/15.jpg");

        if(!mat.data)

        {

            qDebug() << __FILE__ << __LINE__ << "Failed to read image!!!";

            return;

        }

//        cv::dnn::blobFromImage(mat, blob);

        // 必须要设置，否则会跑飞

        cv::dnn::blobFromImage(mat,

                               blob,

                               1.0f/255,

                               cv::Size(320, 320),

                               cv::Scalar(0, 0, 0),

                               true,

                               false);

        net.setInput(blob);

        // 推理预测：可以输入预测的图层名称

        std::vector<cv::Mat> probs;

        net.forward(probs, outPutNames);

        // 显示识别花费的时间

        std::vector<double> layersTimes;

        double freq = cv::getTickFrequency() / 1000;

        double t = net.getPerfProfile(layersTimes) / freq;

        std::string label = cv::format("Inference time: %.2f ms", t);

        cv::putText(mat,

                  label,

                  cv::Point(0, 15),

                  cv::FONT_HERSHEY_SIMPLEX,

                  0.5,

                  cv::Scalar(255, 0, 0));

        // 置信度预制，大于执行度的将其使用rect框出来

        for(int index = 0; index < probs.size(); index++)

        {

            for (int row = 0; row < probs[index].rows; row++)

            {

                // 获取probs中一个元素里面匹配对的所有对象中得分最高的

                cv::Mat scores = probs[index].row(row).colRange(5, probs[index].cols);

                cv::Point classIdPoint;

                double confidence;

                // Get the value and location of the maximum score

                cv::minMaxLoc(scores, 0, &confidence, 0, &classIdPoint);

                if(confidence > 0.6)

                {

                    qDebug() << __FILE__ << __LINE__ << confidence << classIdPoint.x;

                    int centerX = (int)(probs.at(index).at<float>(row, 0) * mat.cols);

                    int centerY = (int)(probs.at(index).at<float>(row, 1) * mat.rows);

                    int width   = (int)(probs.at(index).at<float>(row, 2) * mat.cols);

                    int height  = (int)(probs.at(index).at<float>(row, 3) * mat.rows);

                    int left = centerX - width / 2;

                    int top = centerY - height / 2;

                    cv::Rect objectRect(left, top, width, height);

                    cv::rectangle(mat, objectRect, cv::Scalar(255, 0, 0), 2);

                    cv::String label = cv::format("%s:%.4f",

                                                  classes[classIdPoint.x].data(),

                                                  confidence);

                    cv::putText(mat,

                                label,

                                cv::Point(left, top - 10),

                                cv::FONT_HERSHEY_SIMPLEX,

                                0.4,

                                cv::Scalar(0, 0, 255));

                    qDebug() << __FILE__ << __LINE__

                            << centerX << centerY << width << height;

                }

            }

        }

        cv::imshow(_windowTitle.toStdString(), mat);

        cv::waitKey(0);

    }

}

对应工程模板v1.65.0

openCVDemo_v1.65.0_基础模板_yolov3分类检测.rar。

入坑

入坑一：加载模型时候错误

错误

原因
模型文件加载错误。
解决
检查文件是否存在，路径是否正确，模型文件是否能对应上。

入坑二：输入blob时错误

错误

原因
预测的时候未输入参数，需要输入参数（注意：tensorflow未输入没有问题）。
解决

上一篇：《OpenCV开发笔记（七十二）：红胖子8分钟带你使用opencv+dnn+tensorFlow识别物体》
下一篇：持续补充中…

OpenCV开发笔记（七十三）：红胖子8分钟带你使用opencv+dnn+yolov3识别物体的更多相关文章

OpenCV开发笔记（七十二）：红胖子8分钟带你使用opencv+dnn+tensorFlow识别物体
前言级联分类器的效果并不是很好,准确度相对深度学习较低,本章使用opencv通过tensorflow深度学习,检测已有模型的分类. Demo 可以猜测,1其实是人,18序号类是狗 ...
OpenCV开发笔记（七十一）：红胖子8分钟带你深入级联分类器训练
前言红胖子,来也! 做图像处理,经常头痛的是明明分离出来了(非颜色的),分为几块区域,那怎么知道这几块区域到底哪一块是我们需要的,那么这部分就涉及到需要识别了. 识别可以自己写模板匹配.特征 ...
OpenCV开发笔记（六十五）：红胖子8分钟带你深入了解ORB特征点（图文并茂+浅显易懂+程序源码）
若该文为原创文章,未经允许不得转载原博主博客地址:https://blog.csdn.net/qq21497936原博主博客导航:https://blog.csdn.net/qq21497936/ar ...
OpenCV开发笔记（六十九）：红胖子8分钟带你使用传统方法识别已知物体（图文并茂+浅显易懂+程序源码）
若该文为原创文章,未经允许不得转载原博主博客地址:https://blog.csdn.net/qq21497936原博主博客导航:https://blog.csdn.net/qq21497936/ar ...
OpenCV开发笔记（六十四）：红胖子8分钟带你深入了解SURF特征点（图文并茂+浅显易懂+程序源码）
若该文为原创文章,未经允许不得转载原博主博客地址:https://blog.csdn.net/qq21497936原博主博客导航:https://blog.csdn.net/qq21497936/ar ...
OpenCV开发笔记（五十五）：红胖子8分钟带你深入了解Haar、LBP特征以及级联分类器识别过程（图文并茂+浅显易懂+程序源码）
若该文为原创文章,未经允许不得转载原博主博客地址:https://blog.csdn.net/qq21497936原博主博客导航:https://blog.csdn.net/qq21497936/ar ...
OpenCV开发笔记（五十六）：红胖子8分钟带你深入了解多种图形拟合逼近轮廓（图文并茂+浅显易懂+程序源码）
若该文为原创文章,未经允许不得转载原博主博客地址:https://blog.csdn.net/qq21497936原博主博客导航:https://blog.csdn.net/qq21497936/ar ...
OpenCV开发笔记（七十四）：OpenCV3.4.1+ffmpeg3.4.8交叉编译移植到海思平台Hi35xx平台
前言移植opencv到海思平台,opencv支持对视频进行解码,需要对应的ffmpeg支持. Ffmpeg的移植 Ffmpeg的移植请参考之前的文章:<FFmpeg开发笔记(十): ...
【opencv学习笔记七】访问图像中的像素与图像亮度对比度调整
今天我们来看一下如何访问图像的像素,以及如何改变图像的亮度与对比度. 在之前我们先来看一下图像矩阵数据的排列方式.我们以一个简单的矩阵来说明: 对单通道图像排列如下: 对于双通道图像排列如下: 那么对 ...

随机推荐

Redis小记（二）
1.redis数据库 redis数据库属于内存数据库,若不将数据存到磁盘中,服务器进程退出,数据也会消失 redis所有数据库都保存在redisServer结构的db数组中,db数组的每一项都是一个r ...
Python-维护排序好的序列模块-bisect
bisect模块处理已经排序的序列,升序,从小到大,分插入数据和查看插入数据的位置两大核心,类似于插入排序算法插入数据 # 首先这个序列按升序规则已经排序好的 # 查找规则是二分查找,当数据相等的 ...
Go-The process cannot access the file because it is being used by another process.
where? Go程序在读取文件时候 why? 因为有其他进程也在读取和Go程序想要读取的文件,参数冲突 way? 关闭其他程序进程对该文件的读取操作
【CF1425H】Huge Boxes of Animal Toys 题解
原题链接题意简介: 已知分别处在 \((-\infty,-1]\) H.\((-1,0)\) .\((0,1)\) .\([1,\infty)\) 的实数的数量(下记为集合 \(A,B,C,D\) ...
(leetcode每日打卡)秋叶收藏集【动态规划】
LCP 19.秋叶收藏集题目链接算法动态规划时间复杂度O(n) 1.题目要求最终形成[红.黄.红]三部分,每部分数量可以不相等,问最终调整操作数量最小是多少.这道题一开始考虑暴力去做,枚举两个 ...
Paxos 协议
可用性与一致性为了向用户提供更好的服务体验,现代软件架构越来越注重系统的可用性availability. 正是在这种趋势的驱动下,微服务与容器化技术才能在今天大行其道. 而高可用架构的前提是冗余: ...
Mac 效率工具必备神器 —— Alfred
前言 alfred 这款软件称为「神器」真是当之无愧.今天专门总结一下,作为之前 Mac 配置教程-开发篇的补充. 需要说明的是,如果你发现我介绍的功能无法使用,则代表需要花钱购买它的 Powerp ...
C/的常用位运算符
双目运算符位逻辑运算符有6种位运算: & 与运算 | 或运算 ^ 异或运算 ! 非运算(求补) >> 右移运算 << 左移运算与运算(&)双目运算.二个位 ...
在IDEA创建类时自动创建作者日期等信息设定
1.效果 1 package com.dream.test; 2 3 /* 4 * @author 匠人码农 5 * @date 2020/04/18 11:17 6 * 概要: 7 * XXXXX ...
matlab中nargin函数输入参数数目
来源:https://ww2.mathworks.cn/help/matlab/ref/nargin.html?searchHighlight=nargin&s_tid=doc_srchtit ...

OpenCV开发笔记（七十三）：红胖子8分钟带你使用opencv+dnn+yolov3识别物体

前言

Demo

yolov3模型下载

OpenCV深度识别基本流程

支持的模型

操作步骤：yolov3

步骤一：读取分类文件

步骤二：加载模型和配置文件，建立神经网络。

步骤三：将要预测的图片加入到神经网络中

步骤四：分类预测，获取识别的结果

步骤五：对达到置信度的可以通过输出的mat进行分类和框选

函数原型

读取yolov3模型与配置文件函数原型

读取图片（需要识别的）函数原型

设置神经网络输入函数原型

返回所有层的名称（按照本身的索引循序排列）

返回具有未连接输出的层的索引。

深度检测识别（向前预测）函数原型

Demo

对应工程模板v1.65.0

入坑

入坑一：加载模型时候错误

入坑二：输入blob时错误

OpenCV开发笔记（七十三）：红胖子8分钟带你使用opencv+dnn+yolov3识别物体的更多相关文章

随机推荐

热门专题