caffe 的架构设计及其依赖包的解析
caffe(全称,Convolution Architecture For Feature Extraction) 的安装之所以困难,在于其依赖了大量的第三方开源库:
- 为了读取图像,以及简单的图像处理(拉伸,颜色变化),链接很重的 OpenCV 库
- boost(未来会成为 C++ 的标准,就像STL) 来实现一些 C++11 的特征
- HD5/LMDB/LEVELDB 用来做数据 IO(训练集)
- 避免大量的碎片文件,ImageNet有几百万张图像,(128k的小文件)
- 仅仅是 DB,还不是关系型
- ProtoBuffer(google) 的使用随处可见
- 引入 Protocol buffer 技术,省去编写大量描述性(描述的性质,并不代表可编程性)的 C++ 代码,比如配置参数,属性变量等;
- 这些可以被 protobuffer 的编译器自动地生成 .h 文件和 .cc 文件(在同一个文件夹下)
- 方便序列化,用户可以直接阅读 prototxt 文件,来了解网络结构;
- 引入 Protocol buffer 技术,省去编写大量描述性(描述的性质,并不代表可编程性)的 C++ 代码,比如配置参数,属性变量等;
当然这些如果是放在 Linux 平台下进行安转的话,安装是十分简单的。
1. Caffe 的基本架构
caffe(torch) 是基于层(前向和后向)的设计思路:
Blob 模块,实现了 Tensor(张量,可以通俗地理解为多维矩阵的意思) 的功能,保存数量和梯度值,其具有 4 个维度,分别是:
- number,chanel,height,width
Layer 模块,根据输入(bottom)blob 计算输出 (top)blob,同时保存权重/梯度(神经网络,从图的观点其实代表着DAG,有向无环图),
Net 模块:由多个 layer 组成,实现 forward/backward 计算;
- 从 UML 的关系考虑 Layer 类和 Net 的关系,应当类似于:汽车(Net)与轮胎(Layer),是一种聚合的关系(aggregation)
- C++基础——用C++实例理解UML类图
Solver 模块, 最优化模块,利用梯度值更新权重,
2. caffe 的训练方式
- 需要提前准备数据,保存为 LMDB/LevelDB 等格式(编写脚本);
- 不需编写 C++ 代码,直接编写 .prototxt 定义 Net 对象;
- 直接编写 .prototxt 定义 solver 对象;(用于训练)
- 通过参数直接执行 caffe 命令进行训练;
3. 依赖包
ProtoBuffer:由 caffe 定义的模型,都需要有一个
solver.prototxt文件,其中记录了模型训练所需要的超参,用 caffe 训练时会首先读取该文件,获得其中特定字段的数值,并据此设置内存中模型训练时的超参数变量值;using google::protobuf::io::FileInputStream; const char* filename = "solver.prototxt";
int fid = open(filename, O_RDONLY);
FileInputStream* input = new FileInputStream(fid); caffe::SolverParam solver_param; google::protobuf::TextFormat::Parse(input, &solver_param);
BLAS:卷积神经网络中用到的数学计算主要是矩阵向量的运算,caffe 中调用了 BLAS(Basic Linear Algebra Subprograms,基本线性代数子程序)中的相应方法,最常用的 BLAS 实现主要有以下几种:
- Intel MKL
- ATLAS
- OpenBLAS
caffe 可以选择其中其中任意一种,通过对 Makefile.config 编译文件的配置。Makefile.config 配置文件关于 BLAS 的设置如下所示:
# BLAS choice:
# atlas for ATLAS (default)
# mkl for MKL
# open for OpenBlas
BLAS := atlas
caffe 的架构设计及其依赖包的解析的更多相关文章
- Java生鲜电商平台-电商中海量搜索ElasticSearch架构设计实战与源码解析
Java生鲜电商平台-电商中海量搜索ElasticSearch架构设计实战与源码解析 生鲜电商搜索引擎的特点 众所周知,标准的搜索引擎主要分成三个大的部分,第一步是爬虫系统,第二步是数据分析,第三步才 ...
- Caffe实战三(依赖包解析及环境配置)
前面的文章使用的软件环境是开始时通过apt-get命令所安装的,本文将通过编译源码的方式重新配置一个可迁移的软件环境.(参考:<深度学习 21天实战Caffe> 第五天 Caffe依赖包解 ...
- 架构设计:远程调用服务架构设计及zookeeper技术详解(下篇)
一.下篇开头的废话 终于开写下篇了,这也是我写远程调用框架的第三篇文章,前两篇都被博客园作为[编辑推荐]的文章,很兴奋哦,嘿嘿~~~~,本人是个很臭美的人,一定得要截图为证: 今天是2014年的第一天 ...
- VICA 架构设计(1)
本文记录最近完成的一个通用实时通信客户端的架构. 背景 我们公司是做税务相关的软件,有针对大客户 MIS 系统,也有针对中小客户的 SaaS 平台.这些系统虽然都是 B/S 的,但是也需要使用 A ...
- [转]Android App整体架构设计的思考
1. 架构设计的目的 对程序进行架构设计的原因,归根到底是为了提高生产力.通过设计使程序模块化,做到模块内部的高聚合和模块之间的低耦合.这样做的好处是使得程序在开发的过程中,开发人员只需要专注于一点, ...
- iOS应用架构谈(一):架构设计的方法论
当我们讨论客户端应用架构的时候,我们在讨论什么? 其实市面上大部分应用不外乎就是颠过来倒过去地做以下这些事情: 简单来说就是调API,展示页面,然后跳转到别的地方再调API,再展示页面. 那这有什么好 ...
- iOS应用架构谈:架构设计的方法论
缘由 之前安居客iOS app的第二版架构大部分内容是我做的,期间有总结了一些经验.在将近一年之后,前同事zzz在微信朋友圈上发了一个问题:假如问你一个iOS or Android app的架构,你会 ...
- mysql性能调优与架构设计笔记
1.mysql基本介绍 mysql支持多线程高并发的关系型数据库; 数据库存储引擎InnoDB.MyISAM; mysql快速崛起的原因就是他是开源的; 性能一直是mysql自豪的一大特点; 2.my ...
- VICA 架构设计
本文记录最近完成的一个通用实时通信客户端的架构. 背景 我们公司是做税务相关的软件,有针对大客户 MIS 系统,也有针对中小客户的 SaaS 平台.这些系统虽然都是 B/S 的,但是也需要使用 Act ...
随机推荐
- 解决Linux动态库版本兼容问题
说道“动态库版本兼容”,很多人头脑中首先蹦出的就是“Dll Hell”.啊,这曾经让人头疼的难题.时至今日,这个难题已经很好地解决了. 在进一步讨论之前来思考一个问题:Linux下为什么没有让人头痛的 ...
- FireBreath与JS交互1
FireBreath提供接口供JS调用,提供的接口需要注册 必须在JSAPI对象的构造函数中注册,也就是 CxxxAPI::CxxxAPI()这个函数中调用 registerMethod(" ...
- Java 线程第三版 第九章 Thread调度 读书笔记
一.Thread调度的概述 import java.util.*; import java.text.*; public class Task implements Runnable { long n ...
- 如何在hadoop中控制map的个数 分类: A1_HADOOP 2015-03-13 20:53 86人阅读 评论(0) 收藏
hadooop提供了一个设置map个数的参数mapred.map.tasks,我们可以通过这个参数来控制map的个数.但是通过这种方式设置map的个数,并不是每次都有效的.原因是mapred.map. ...
- 如何在移动web模仿客户端给input输入框添加自定义清除按钮
项目有个需求就是在input输入框添加清除按钮,网上查找资料加上自己琢磨终于弄出来了. 灵感来自于 http://www.zhangxinxu.com/wordpress/?p=4077 由于项目已经 ...
- Bash玩转脚本1之自己的脚本安装程序
Bash之打造自己的脚本安装器 前言 还是理所当然的前言,我一直想找一套管理脚本的"框架",能让自己杂乱的脚本有点规整.无奈眼界尚浅,未能找到. 因此萌生自己写一点优化脚本的工具来 ...
- 指针知识梳理6-const与指针
const 定义的变量为仅仅读变量.在语法层面上通过这个变量去改动内存是不同意的. 可是对于下面代码.就有非常多人绕了: const int *p1; //p1能变.*p1不能变 int cons ...
- [Java][web]利用Spring随时随地获得Request和Session
利用Spring随时随地获得Request和Session 一.准备工作: 在web.xml中加入 <listener> <listener-class> org.spring ...
- mysql使用substring_index达到splite功能
函数: 1.从左开始截取字符串 left(str, length) 说明:left(被截取字段,截取长度) 例:select left(content,200) as abstract from my ...
- 适合前端开发的 Chrome 扩展有哪些?(十款)
适合前端开发的 Chrome 扩展有哪些?(十款) 一.总结 好的插件或者框架对程序员的意义重大. 二.适合前端开发的 Chrome 扩展有哪些?(十款) 掘金是一个高质量的技术社区,从 ECMASc ...