Guide

set_mode

Caffe fails to use GPU in a new thread ？？？

see here

the `Caffe::mode_` variable that controls this is thread-local,

so ensure you’re calling `caffe.set_mode_gpu()` in each thread

before running any Caffe functions. That should solve your issue.

Caffe set_mode GPU 在多线程下失效

在main thread中设置GPU模式，在worker thread中调用网络进行检测，

GPU模式不起效，默认仍然使用CPU模式，所以速度很慢，和GPU相比慢了

10倍左右。

解决方案：在子线程中set_mode,然后调用网络进行检测。

(1)创建网络在main thread。static 网络存储在全局静态数据区。

worker thread可以直接使用。

(2) 在worker thread中检测，需要在子线程中set_mode,然后调用网络进行检测。

结论：

(1)caffe的set_mode所在的线程必须和使用nets进行forward的线程相同。否则默认使用CPU模式，速度会很慢。

(2)caffe的nets初始化可以在main thread也可以在worker thread。

code example

#include <iostream>

#include <string>

#include <thread>

#include <gtest/gtest.h>

#include <glog/logging.h>

#include <boost/date_time/posix_time/posix_time.hpp>  

// opencv

#include <opencv2/core.hpp>

#include <opencv2/highgui.hpp>

#include <opencv2/imgproc.hpp>

using namespace std;

#include "algorithm/algorithm.h"

using namespace kezunlin::algorithm;

#pragma region net-demo

void topwire_demo(bool run_in_worker_thread)

{

	if (run_in_worker_thread) {

		CaffeApi::set_mode(true, 0, 1234);// set in worker thread-1, use GPU-0

	}

    // do net detect

    // ...

}

void railway_demo(bool run_in_worker_thread)

{

	if (run_in_worker_thread) {

		CaffeApi::set_mode(true, 0, 1234);// set in worker thread-1, use GPU-0

	}

    // do net detect

    // ...

}

void sidewall_demo(bool run_in_worker_thread)

{

	if (run_in_worker_thread) {

		CaffeApi::set_mode(true, 0, 1234);// set in worker thread-1, use GPU-0

	}

    // do net detect

    // ...

}

void lockcatch_demo(bool run_in_worker_thread)

{

	if (run_in_worker_thread) {

		CaffeApi::set_mode(true, 0, 1234);// set in worker thread-1, use GPU-0

	}

	// do net detect

    // ...

}

#pragma endregion

#pragma region worker-thread-demo

void worker_thread_topwire_demo(bool run_in_worker_thread)

{

	std::thread thr(topwire_demo, run_in_worker_thread);

	thr.join();

}

void worker_thread_railway_demo(bool run_in_worker_thread)

{

	std::thread thr(railway_demo, run_in_worker_thread);

	thr.join();

}

void worker_thread_sidewall_demo(bool run_in_worker_thread)

{

	std::thread thr(sidewall_demo, run_in_worker_thread);

	thr.join();

}

void worker_thread_lockcatch_demo(bool run_in_worker_thread)

{

	std::thread thr(lockcatch_demo, run_in_worker_thread);

	thr.join();

}

#pragma endregion

enum DETECT_TYPE {

	SET_IN_MAIN_DETECT_IN_MAIN, // 主线程set_mode，主线程检测，40ms左右，使用GPU

	SET_IN_WORKER_DETECT_IN_WORKER, // 子线程set_mode，子线程检测，40ms左右，使用GPU

	SET_IN_MAIN_DETECT_IN_WORKER // 主线程set_mode，子线程检测，400ms左右，慢了10倍左右，没有使用GPU

};

void thread_demo()

{

	DETECT_TYPE detect_type = SET_IN_MAIN_DETECT_IN_MAIN;

	detect_type = SET_IN_WORKER_DETECT_IN_WORKER;

	detect_type = SET_IN_MAIN_DETECT_IN_WORKER;

	init_algorithm_api();

	switch (detect_type)

	{

	case SET_IN_MAIN_DETECT_IN_MAIN:

		topwire_demo(false);

		railway_demo(false);

		sidewall_demo(false);

		lockcatch_demo(false);

		break;

	case SET_IN_WORKER_DETECT_IN_WORKER:

		worker_thread_topwire_demo(true);

		worker_thread_railway_demo(true);

		worker_thread_sidewall_demo(true);

		worker_thread_lockcatch_demo(true);

		break;

	case SET_IN_MAIN_DETECT_IN_WORKER:

		worker_thread_topwire_demo(false);

		worker_thread_railway_demo(false);

		worker_thread_sidewall_demo(false);

		worker_thread_lockcatch_demo(false);

		break;

	default:

		break;

	}

	free_algorithm_api();

}

void test_algorithm_api()

{

	thread_demo();

}

TEST(algorithn_test, test_algorithm_api) {

	test_algorithm_api();

}

SET_IN_MAIN_DETECT_IN_MAIN, // 主线程set_mode，主线程检测，40ms左右，使用GPU
SET_IN_WORKER_DETECT_IN_WORKER, // 子线程set_mode，子线程检测，40ms左右，使用GPU
SET_IN_MAIN_DETECT_IN_WORKER // 主线程set_mode，子线程检测，400ms左右，慢了10倍左右，没有使用GPU

Reference

Caffe fails to use GPU in a new thread

History

20180712: created.

Copyright

Post author: kezunlin
Post link: https://kezunlin.me/post/8d877e63/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 3.0 unless stating additionally.

caffe网络在多线程中无法使用GPU的解决方案 | cpp caffe net run in multiple threads的更多相关文章

.netcore中无法使用System.Drawing --解决方案
问题重现: 无法正常使用解决方法: 安装System.Drawing.Common的NuGet就能正常使用了操作之后: 这个是.netcoe中的解决办法,.net framework解决方案中添 ...
Java多线程中的常用方法
本文将带你讲诉Java多线程中的常用方法 Java多线程中的常用方法有如下几个 start,run,sleep,wait,notify,notifyAll,join,isAlive,current ...
为什么多线程、junit 中无法使用spring 依赖注入？
为什么多线程.junit 中无法使用spring 依赖注入? 这个问题,其实体现了,我们对spring已依赖太深,以至于不想自己写实例了. 那么到底是为什么在多线程和junit单元测试中不能使用依赖注 ...
网络与多线程---OC中多线程使用方法(一)
小编在此之前,通过一个小例子,简单的形容了一下进程与线程之间的关系,现在网络编程中的多线程说一下!!! *进程的基本概念每一个进程都是一个应用程序,都有自己独立的内存空间,一般来说一个应用程序存在一 ...
boost中asio网络库多线程并发处理实现，以及asio在多线程模型中线程的调度情况和线程安全。
1.实现多线程方法: 其实就是多个线程同时调用io_service::run for (int i = 0; i != m_nThreads; ++i) { boo ...
c#初学-多线程中lock用法的经典实例
本文转载自:http://www.cnblogs.com/promise-7/articles/2354077.html 一.Lock定义 lock 关键字可以用来确保代码块完成运行,而不会被 ...
iOS多线程中，队列和执行的排列组合结果分析
本文是对以往学习的多线程中知识点的一个整理. 多线程中的队列有:串行队列,并发队列,全局队列,主队列. 执行的方法有:同步执行和异步执行.那么两两一组合会有哪些注意事项呢? 如果不是在董铂然博客园看到 ...
iOS开发网络篇—多线程断点下载
iOS开发网络篇—多线程断点下载说明:本文介绍多线程断点下载.项目中使用了苹果自带的类,实现了同时开启多条线程下载一个较大的文件.因为实现过程较为复杂,所以下面贴出完整的代码. 实现思路:下载开始, ...
多线程中lock用法的经典实例
多线程中lock用法的经典实例一.Lock定义 lock 关键字可以用来确保代码块完成运行,而不会被其他线程中断.它可以把一段代码定义为互斥段(critical section),互斥段在一 ...

随机推荐

Spring Cloud - Eureka /actuator/info 如何显示信息
在pom.xml中添加  <dependency> <groupId>org.springframework.boot ...
解决错误系统找不到指定的批标签 make_command_arguments |hadoop windows出错
问题:cmd命令行传参数出错此文章适用于 cmd命令行传参数出错在windows 7下倒腾 Hadoop 时出现 The system cannot find the batch label s ...
面对对象高阶+反射+魔法方法+单例(day22)
目录昨日内容组合封装 property装饰器多态鸭子类型今日内容 classmethod staticmethod 面对对象高级 isinstance issubclass 反射(重要) ...
Vue躬行记（5）——组件通信
组件之间除了保持独立之外,还需要相互通信,本章将介绍几种通信的方式. 一.直接访问 Vue提供了三个实例属性,可直接访问父组件.子组件和根实例,如下所列. (1)$parent:父组件. (2)$ro ...
Java内存模型(JMM)详解
在Java JVM系列文章中有朋友问为什么要JVM,Java虚拟机不是已经帮我们处理好了么?同样,学习Java内存模型也有同样的问题,为什么要学习Java内存模型.它们的答案是一致的:能够让我们更好的 ...
百度地图Javascript API 调用示例
调用示例 !<!DOCTYPE html> <html> <head> <title>百度地图DEMO</title> </head& ...
SQL 中更新一个表的数据是从另外的表(或者自己本身的表)查询出来的
模板1: update 表1 set 表1.字段1 = ( select 表1字段或者表2字段 from 表2 where 表1主键 = 表2外键及其他条件 ) where 表1.字段 = ...
刷题翻车：python 布尔运算操作符的优先级
前两天在 xue.cn 体验答题挑战,我有道题做错了,却不明白错在哪里.题目大概如下,代码运行后将打印什么? if True or False and False: print('1') else: ...
长寿花：dp
当然可以打组合数+CRT什么的,但是其实不必那么麻烦. 先讲那个思路,再转化过来吧. 首先可以发现的一个问题:所有颜色之间是没有区别的,所以我们其实并不在意到底是哪几种,我们只需要知道有几种就可以了. ...
HTML知识点汇总
一.什么是HTML HTML是用来描述网页的一种语言. HTML是指超文本标记语言(不仅包含纯文本,还包含图片.超链接.音频.视频等). HTML使用一套标记标签来描述网页. 二.HTML标签的作用 ...

caffe网络在多线程中无法使用GPU的解决方案 | cpp caffe net run in multiple threads

Guide

set_mode

code example

Reference

History

Copyright

caffe网络在多线程中无法使用GPU的解决方案 | cpp caffe net run in multiple threads的更多相关文章

随机推荐

热门专题