工作环境

巧妇有了米炊

众所周知,Caffe是在Linux下写的,所以长久以来,大家都认为跑Caffe,先装Linux。

niuzhiheng大神发起了caffe-windows项目(解决了一些编译、API相异问题)

以及willyd大神发起的caffe-windows-dependencies项目(整理了依赖库,修正了LMDB在NTFS分区的Bug)

我们现在可以很欢乐地在Windows上研究Caffe源码,以及山寨它了。

编辑器

在Windows下涉及CUDA,Visual Studio必然是首选。如果问原因,这是NVIDIA官方的推荐。

CUDA最初使用的语言,除了二进制机器码,就是类似CPU汇编的,GPU汇编——PTX代码。

后来NVIDIA的工程师写了C接口,编译器称为NVCC。

NVCC相当有趣,它在编译前,需要对CUDA代码以及传统C/C++代码做分离。

这一步给模板(Template)分离式编程带来比较大的麻烦,C/C++编译器和NVCC编译器不共享某些知识,

所以你需要重复某些代码。(幸好我们有宏)

CUDA的地位与DirectX差不多,后者是MS为GPU封装的C++接口。

CUDA、OpenCL、DirectX旗下的Direct Compute并称为GPGPU通用计算的三个小王子。

当然,CUDA属于那种为了夺嫡开挂的小人,目前你看到的CUDA框架,只限于NVIDIA GPU,

因为它在设计的时候,没有从通用GPU出发,直接在自家的硬件物理架构上设计,所以优势很大。

再说Windows,玩过游戏的人都知道,NVIDIA和MS是多年友商了。

玩游戏有句信条:千万不要用Linux。这句话可以从两方面解释:

(I) NVIDIA为Windows全心全意做驱动程序,证据是Linux装显卡驱动曾经

是一个老大难问题,无数人抱怨,“NVIDIA就是MS的奸细”。

(II) 很少有开发者用Linux API写游戏(PC端)

这个现象最近有所改观,基础驱动和CUDA也为部分Linux提供了支持(Ubuntu)。

就连CES2016上,老黄演示无人驾驶系统Drive PX 2 Demo居然也是跑在Linux(Ubuntu)上。

似乎还被人看出来跑的是Caffe(疑似),但不论则么说,NVIDIA现在是对Linux有所关注了。

为了体现与MS的友谊,CUDA几乎是与Visual Studio捆绑的,前提你得先装VS。

CUDA会把插件和配置直接自动写到VS里去。

配置NVCC和以及传统C/C++编译器相当繁琐,如果你是民间大神,可以尝试Vim或Sublime。

但是,最好不要这么作死,VS其实也不是很难用。

OS及VS

我个人在Windows10 Threshold 1下工作。

VS使用是Metro先锋VS2013,相当老掉牙的版本。(VS 2012及以下的UI相当丑,因为同年8月才出了Windows8)。

VS的默认工作模式是X64 Release。

依赖环境库

你的VS工作环境,决定了你的依赖库是如何使用的。

依赖库有“大三元”的说法:

如图,就是这三个目录,分别存着:动态库、引用头文件,静态库。

(I)先说说静态库,VS的静态库是lib文件,GCC的静态库是a文件。

静态库只能在编译阶段的链接器中使用,这与C/C++的分离式编程有关。

众所周知,C/C++倡导声明定义分离,这大大加快了整体编译速度,以及方便外部调用。

于是编译阶段分为两部门:先进行声明的分析,然后再把定义填充进去。

声明的全部内容通常是提供给外部的,是由零碎的头文件组成,你想用就#include就好了。

定义的内容,会被链接器灌装起来。根据灌装模式的不同,就出现了静态编译和动态编译两类。

根据生成内容的不同,又可以分为可执行文件生成和库生成两类。

利用笛卡尔积,我们大概得到四种模式:

★库生成,静态编译( h文件+lib文件(VC) 或者h文件+a文件(GCC) )

★库生成,动态编译  (不存在)

★可执行文件生成,静态编译 (exe文件)

★可执行文件生成,动态编译 ( exe文件+dll or bin文件+so文件(Linux) )

其中第二种方式是不存在的。所以针对库生成而言,我们只需要h+lib/a文件即可。

它们应当分别放到include和lib文件夹中。

在VS中配置头文件/静态库很简单,分为两步:

★在工程属性-VC++目录中指定"包含目录"以及”库目录“,分别为h目录以及lib目录

★在工程属性-链接器-输入中,手动添加需要的lib文件

第二步相当重要,如果不做,那么编译是不会错的,但是在链接定义的时候,会找不到lib中的定义:

error LNK2001: 无法解析的外部符号

如果你的lib目录没错,那么试着找一找,是不是没有手动添加lib文件(VS不会自动扫描目录文件并且添加)

(II)再说说动态库,这个方式只有在选择了Release模式编译之后,才会使用。

先说说Debug和Release的区别。

Debug版本一般不用来发布,不仅是因为里面包含了Debug代码,而且没有做编译优化,性能有折扣。

但是有一点好处,就是可以断点、调试,但这非常麻烦。

由于外部依赖库的灌装,你要Debug你的程序,需要提供pdb符号文件,这意味着你得自己把所有依赖库

自己编译一遍,得到pdb文件,否则无法Debug,也就无法断点调试。

因为无法断点,所以Debug只能靠人工推理出断点(推测可能位置,加cout/printf语句测试)

还有一点,就是Debug版本在调试模式中的执行只需要lib文件,如图:

但是,一旦你把Debug版本的exe文件拿到别处,就需要dll文件了,这时候需要动态库。

Release版本则是强制使用动态库,就算是调试模式也无效。

在VS中配置动态库很简单,只要一步

★在工程属性-调试中,指定"环境"的值为:PATH=%PATH%;C:\xxx\bin

确保bin里存在需要的dll文件,否则OS会一致提示你缺少dll文件。

另外,Debug和Release版本需要的lib文件和dll文件均是不同的,不能混用。

一般文件名后补一个"d",表示这是Debug版本的dll/lib。

教学用·快速依赖环境包

这个包仅教学使用,阉割庞大的Boost,直接无视了OpenCV(这东西其实没多大用)。

对于山寨Caffe,足够了。仅仅30MB,适合傻瓜。

强调,请用于: X64 Release

度娘:http://pan.baidu.com/s/1NeDrS

有问题邮箱@我:neopenx@mail.hfut.edu.cn

2016.2.18 更新lmdb.lib

-修正Win32平台下,set end of file error!的输出信息问题

解决方案是在lmdb源码的mdb.c里把这句printf注释掉。

这是一句毫无意义的输出信息,仅仅在Windows平台下被编译出来,强迫症患者可以选择尝试。

度娘:http://pan.baidu.com/s/1sk29YlJ

从零开始山寨Caffe·零:必先利其器的更多相关文章

  1. 从零开始山寨Caffe·陆:IO系统(一)

    你说你学过操作系统这门课?写个无Bug的生产者和消费者模型试试! ——你真的学好了操作系统这门课嘛? 在第壹章,展示过这样图: 其中,左半部分构成了新版Caffe最恼人.最庞大的IO系统. 也是历来最 ...

  2. 从零开始山寨Caffe·伍:Protocol Buffer简易指南

    你为Class外访问private对象而苦恼嘛?你为设计序列化格式而头疼嘛? ——欢迎体验Google Protocol Buffer 面向对象之封装性 历史遗留问题 面向对象中最矛盾的一个特性,就是 ...

  3. 从零开始山寨Caffe·壹:仰望星空与脚踏实地

    请以“仰望星空与脚踏实地”作为题目,写一篇不少于800字的文章.除诗歌外,文体不限. ——2010·北京卷 仰望星空 规范性 Caffe诞生于12年末,如果偏要形容一下这个框架,可以用"须敬 ...

  4. 从零开始山寨Caffe·拾贰:IO系统(四)

    消费者 回忆:生产者提供产品的接口 在第捌章,IO系统(二)中,生产者DataReader提供了外部消费接口: class DataReader { public: ......... Blockin ...

  5. 从零开始山寨Caffe·拾:IO系统(三)

    数据变形 IO(二)中,我们已经将原始数据缓冲至Datum,Datum又存入了生产者缓冲区,不过,这离消费,还早得很呢. 在消费(使用)之前,最重要的一步,就是数据变形. ImageNet Image ...

  6. 从零开始山寨Caffe·玖:BlobFlow

    听说Google出了TensorFlow,那么Caffe应该叫什么? ——BlobFlow 神经网络时代的传播数据结构 我的代码 我最早手写神经网络的时候,Flow结构是这样的: struct Dat ...

  7. 从零开始山寨Caffe·捌:IO系统(二)

    生产者 双缓冲组与信号量机制 在第陆章中提到了,如何模拟,以及取代根本不存的Q.full()函数. 其本质是:除了为生产者提供一个成品缓冲队列,还提供一个零件缓冲队列. 当我们从外部给定了固定容量的零 ...

  8. 从零开始山寨Caffe·柒:KV数据库

    你说你会关系数据库?你说你会Hadoop? 忘掉它们吧,我们既不需要网络支持,也不需要复杂关系模式,只要读写够快就行.    ——论数据存储的本质 浅析数据库技术 内存数据库——STL的map容器 关 ...

  9. 从零开始山寨Caffe·贰:主存模型

    你左手是内存,右手是显存,内存可以打死显存,显存也可以打死内存. —— 请协调好你的主存 从硬件说起 物理之觞 大部分Caffe源码解读都喜欢跳过这部分,我不知道他们是什么心态,因为这恰恰是最重要的一 ...

随机推荐

  1. 关于Java集合的小抄

    在尽可能短的篇幅里,将所有List.Map.Set.Queue的特征与实现方式捋一遍.适合所有"精通Java"其实还不那么自信的人阅读. List ArrayList 以数组实现. ...

  2. foreach statement cannot operate on variables of type 'System.Web.UI.WebControls.Table' because 'System.Web.UI.WebControls.Table' does not contain a public definition for 'GetEnumerator'

    错误:foreach statement cannot operate on variables of type 'System.Web.UI.WebControls.Table' because ' ...

  3. ssh保持链接

    修改/etc/ssh/sshd_config配置文件 ClientAliveInterval 300(默认为0), 参数的是意思是每5分钟,服务器向客户端发一个消息,用于保持连接,使用service ...

  4. golang的ssh包

    git clone https://github.com/golang/crypto.git,复制到 golang.org/x/ 目录下. 常常用来建立ssh连接发送一条命令,但有时需要模拟ssh客户 ...

  5. Android联系人数据库

    转载自http://www.2cto.com/kf/201406/309356.html 通信录是一个3层的数据存储模型,这三个数据模型就是ContactsContact.Data,ContactsC ...

  6. 10款最好的 Bootstrap 3.0 免费主题和模板

    Twitter Bootstrap 框架已经广为人知,用于加快网站,应用程序或主题的界面开发,并被公认为是迄今对于Web开发的最有实质性帮助的工具之一.在此之前的,各种各样的界面库伴随着高昂的维护成本 ...

  7. SSAS动态添加分区(一)

    一.动态分区的好处就不说了,随着时间的推移,不可能一个度量值组都放在一个分区中,处理速度非常慢,如何动态添加分区,如何动态处理分区,成为了很多新手BI工程师一个头痛的问题,废话不多说,分享一下我的经验 ...

  8. HQL常用的查询语句

    摘录自某人,比较有用,比较全. // HQL: Hibernate Query Language. // 特点: // >> 1,与SQL相似,SQL中的语法基本上都可以直接使用. // ...

  9. synchronized在jvm底层是如何实现的

    目前在Java中存在两种锁机制:synchronized和Lock,Lock接口及其实现类是JDK5增加的内容,其作者是大名鼎鼎的并发专家Doug Lea.本文并不比较synchronized与Loc ...

  10. ReactiveCocoa源码拆分解析(七)

    (整个关于ReactiveCocoa的代码工程可以在https://github.com/qianhongqiang/QHQReactive下载) 在这篇博客中,我将把ReactiveCocoa中的擦 ...