caffe中各种cblas的函数使用总结

转来的，来自：http://www.cnblogs.com/huashiyiqike/p/3886670.html

总结的很赞，转到这里，留一下笔记。感觉cblas的函数名字很好记的，试着去找过源代码，但是是fortran的，我当时写过的那些fortran程序早忘记了。

Y=alpha * X +beta*Y

Y=alpha * X +beta*Y 

template <>

void caffe_cpu_axpby<float>(const int N, const float alpha, const float* X,

                            const float beta, float* Y) {

  cblas_saxpby(N, alpha, X, 1, beta, Y, 1);

}

template <>

void caffe_cpu_axpby<double>(const int N, const double alpha, const double* X,

                             const double beta, double* Y) {

  cblas_daxpby(N, alpha, X, 1, beta, Y, 1);

}

 cblas_dscal(N, beta, Y, incY);  Y=Y*beta

  cblas_daxpy(N, alpha, X, incX, Y, incY);  Y= (alpha * X) + Y)

Y=alpha * X + Y

template <>

void caffe_axpy<float>(const int N, const float alpha, const float* X,

    float* Y) { cblas_saxpy(N, alpha, X, 1, Y, 1); }

template <>

void caffe_axpy<double>(const int N, const double alpha, const double* X,

    double* Y) { cblas_daxpy(N, alpha, X, 1, Y, 1); }

DEFINE_VSL_BINARY_FUNC(Add, y[i] = a[i] + b[i]);

DEFINE_VSL_BINARY_FUNC(Sub, y[i] = a[i] - b[i]);

DEFINE_VSL_BINARY_FUNC(Mul, y[i] = a[i] * b[i]);

DEFINE_VSL_BINARY_FUNC(Div, y[i] = a[i] / b[i]);

template <>

void caffe_add<float>(const int n, const float* a, const float* b,

float* y) {

vsAdd(n, a, b, y);

}

template <>

void caffe_add<double>(const int n, const double* a, const double* b,

double* y) {

vdAdd(n, a, b, y);

}

y=x;

template <>

void caffe_copy<float>(const int N, const float* X, float* Y) {

  cblas_scopy(N, X, 1, Y, 1);

}

template <>

void caffe_copy<double>(const int N, const double* X, double* Y) {

  cblas_dcopy(N, X, 1, Y, 1);

}

template <>

void caffe_gpu_copy<float>(const int N, const float* X, float* Y) {

  CUBLAS_CHECK(cublasScopy(Caffe::cublas_handle(), N, X, 1, Y, 1));

}

template <>

void caffe_gpu_copy<double>(const int N, const double* X, double* Y) {

  CUBLAS_CHECK(cublasDcopy(Caffe::cublas_handle(), N, X, 1, Y, 1));

}

　　Computes alpha*x*y' + A.

cblas_sger

Multiplies vector X by the transform of vector Y, then adds matrix A (single precison).

Multiplies vector X by the transform of vector Y, then adds matrix A (single precison).

void cblas_sger (

const enum CBLAS_ORDER Order,

const int M,

const int N,

const float alpha,

const float *X,

const int incX,

const float *Y,

const int incY,

float *A,

const int lda

);

Y(vetor)←αAX + βY

This function multiplies A * X (after transposing A, if needed) and multiplies the resulting matrix by alpha.

It then multiplies vector Y by beta. It stores the sum of these two products in vector Y.

template <>

void caffe_cpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,

    const int N, const float alpha, const float* A, const float* x,

    const float beta, float* y) {

  cblas_sgemv(CblasRowMajor, TransA, M, N, alpha, A, N, x, 1, beta, y, 1);

}

　C(matrix)←αAB + βC

template<typename T>

void gpu_multmat(T* A, T* B, T* C, int M,int K,int N){

     const T alpha = 1,beta=0;

     caffe_gpu_gemm(CblasNoTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);

}

template<>

void caffe_cpu_gemm<float>(const CBLAS_TRANSPOSE TransA,

    const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,

    const float alpha, const float* A, const float* B, const float beta,

    float* C) {

  int lda = (TransA == CblasNoTrans) ? K : M;

  int ldb = (TransB == CblasNoTrans) ? N : K;

  cblas_sgemm(CblasRowMajor, TransA, TransB, M, N, K, alpha, A, lda, B,

      ldb, beta, C, N);

}

A=M*N  B=M*K

C=A'*B   N M K

template<typename T>

void cpu_multTmat(T* A, T* B, T* C, int M,int K,int N){

     const T alpha = 1,beta=0;

     caffe_cpu_gemm(CblasTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);

    // cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M, N, K, alpha, A, M, B,    K, beta, C, M);

}

A=M*N B=N*K

C=A*B   M N K

template<typename T>

void cpu_multmat(T* A, T* B, T* C, int M,int K,int N){

     const T alpha = 1,beta=0;

     caffe_cpu_gemm(CblasNoTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);

    // cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M, N, K, alpha, A, M, B,    K, beta, C, M);

}

caffe中各种cblas的函数使用总结的更多相关文章

caffe中权值初始化方法
首先说明:在caffe/include/caffe中的 filer.hpp文件中有它的源文件,如果想看,可以看看哦,反正我是不想看,代码细节吧,现在不想知道太多,有个宏观的idea就可以啦,如果想看代 ...
在caffe中使用hdf5的数据
caffe默认使用的数据格式为lmdb文件格式,它提供了把图片转为lmdb文件格式的小程序,但是呢,我的数据为一维的数据,我也要分类啊,那我怎么办?肯定有办法可以转为lmdb文件格式的,我也看了一些源 ...
caffe中各层的作用:
关于caffe中的solver: cafffe中的sover的方法都有: Stochastic Gradient Descent (type: "SGD"), AdaDelta ( ...
（原）torch和caffe中的BatchNorm层
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/6015990.html BatchNorm具体网上搜索. caffe中batchNorm层是通过Batc ...
CAFFE中训练与使用阶段网络设计的不同
神经网络中,我们通过最小化神经网络来训练网络,所以在训练时最后一层是损失函数层(LOSS), 在测试时我们通过准确率来评价该网络的优劣,因此最后一层是准确率层(ACCURACY). 但是当我们真正要使 ...
caffe中在某一层获得迭代次数的方法以及caffe编译时报错 error: 'to_string' is not a member of 'std'解决方法
https://stackoverflow.com/questions/38369565/how-to-get-learning-rate-or-iteration-times-when-define ...
caffe中关于（ReLU层，Dropout层，BatchNorm层，Scale层）输入输出层一致的问题
在卷积神经网络中.常见到的激活函数有Relu层 layer { name: "relu1" type: "ReLU" bottom: "pool1&q ...
Batch Normalization 与 Caffe中的相关layer
在机器学习领域,通常假设训练数据与测试数据是同分布的,BatchNorm的作用就是深度神经网络训练过程中, 使得每层神经网络的输入保持同分布. 原因:随着深度神经网络层数的增加,训练越来越困难,收敛越 ...
caffe代码阅读10：Caffe中卷积的实现细节（涉及到BaseConvolutionLayer、ConvolutionLayer、im2col等）-2016.4.3
一. 卷积层的作用简单介绍卷积层是深度神经网络中的一个重要的层,该层实现了局部感受野.通过这样的局部感受野,能够有效地减少參数的数目. 我们将结合caffe来解说详细是怎样实现卷积层的前传和反传的. ...

随机推荐

httpUrlConnection连接网络的用法(用到了handle传递消息,在主线程中更新UI)
由于httpclient在Android5.0以后已经过时,所以官方推荐使用httpUrlConnection来连接网络,现将该连接的基本方法展示,如下注意:记得加入<uses-permiss ...
虚拟机扩容（/dev/mapper/centos-root 空间不足）
1:.首先查看我们的根分区大小是多少 df -h 文件系统类型容量已用可用已用% 挂载点 /dev/mapper/centos-root xfs ...
在线编辑word文档可保存到服务器
使用说明:该方法只在office xp 和 2003上测试通过,2000及以下版本没试. 注意:你要打开的服务器端的word文档要有写权限.iis要开起 web服务扩展中的webdav为允许具体 ...
基础7 面向对象进阶与socket编程
1.静态方法(用得少)(解除某个函数跟类的关联,加了静态方法后,类便不能将类的参数传给静态方法函数了) class Dog(object): def __init__(self,name): @sta ...
MongoDB Windows环境搭建
简介 MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统. 在高负载的情况下,添加更多的节点,可以保证服务器性能. MongoDB 旨在为WEB应用提供可扩展的高性能数据存 ...
MVC 模型过滤
通用返回模型 /// <summary> /// WebApi返回数据的泛型类 /// </summary> /// <typeparam name="T&qu ...
pop3密码嗅探
成品与代码可在 https://pan.baidu.com/s/1MPfU2T_6YN6mgxUL0wrZxw 下载来说下pop协议, 英文版,https://tools.ietf.org/html ...
让GIt忽略SSL证书错误的方法
当你通过HTTPS访问Git远程仓库,如果服务器的SSL证书未经过第三方机构签署,那么Git就会报错.这是十分合理的设计,毕竟未知的没有签署过的证书意味着很大安全风险.但是,如果你正好在架设Git服务 ...
SpringBoot系列之——整合JPA、mysql
一.JPA 1. 概念:JPA顾名思义就是Java Persistence API的意思,是JDK 5.0注解或XML描述对象-关系表的映射关系,并将运行期的实体对象持久化到数据库中. 2. ...
【转】带你正确的使用List的retainAll方法求交集
一. retainAll 方法 public boolean retainAll(Collection<?> c) { //调用自己的私有方法 return batchRemove(c, ...

caffe中各种cblas的函数使用总结

caffe中各种cblas的函数使用总结的更多相关文章

随机推荐

热门专题