（原）mkl的cblas_sgemm和cblas

转载请注明出处：

http://www.cnblogs.com/darkknightzh/p/5553336.html

参考网址：

mkl-11.3.2-developer-reference-c_0.pdf（intel官网下载）

http://goodluck1982.blog.sohu.com/94851969.html

void cblas_sgemm(const CBLAS_LAYOUT Layout, const CBLAS_TRANSPOSE transa, const CBLAS_TRANSPOSE transb, const MKL_INT m, const MKL_INT n, const MKL_INT k, const float alpha, const float *a, const MKL_INT lda, const float *b, const MKL_INT ldb, const float beta, float *c, const MKL_INT ldc);

void cblas_dgemm(const CBLAS_LAYOUT Layout, const CBLAS_TRANSPOSE transa, const CBLAS_TRANSPOSE transb, const MKL_INT m, const MKL_INT n, const MKL_INT k, const double    alpha, const double *a, const MKL_INT lda, const double *b, const MKL_INT ldb, const double beta, double *c, const MKL_INT ldc);

参考intel的官方pdf手册

计算：C := alpha*op(A)*op(B) + beta*C

注意：a、b、c指输入的缓冲区，A、B、C指真正需要计算的缓冲区（如果需要对一小块矩阵进行计算，这两组就不一样了）。

其中，op(X) 表示：

op(X) = X，原始矩阵

op(X) = ${{X}^{T}}$，转置矩阵

op(X) = ${{X}^{H}}$，共轭矩阵

A为m*k的矩阵（m行k列）

B为k*n的矩阵

C为m*n的矩阵

参数：

Layout：表示二维矩阵存储是按行优先（CblasRowMajor）还是列优先（CblasColMajor）。

C++里面是行优先存储的；fortran是列优先存储数据。（为了让fortran调用方便吧）

transa、transb：可为CblasNoTrans、CblasTrans、CblasConjTrans

m：矩阵a和c的行数

n：矩阵b和c的列数

k：矩阵a的列数，矩阵c的行数

lda：行优先 & 不转置时，$lda\ge \max (1,k)$

行优先 & 转置时，$lda\ge \max (1,m)$

由于用的是C++，不太可能会使用fortran，列优先就不管了（ldb和ldc也不考虑）

ldb：行优先 & 不转置时，ldb*k的矩阵，b矩阵左上角包含n*k的B矩阵

行优先 & 转置时，ldb*n的矩阵，b矩阵左上角包含k*n的B矩阵

ldc：行优先时，$ldc\ge \max (1,n)$

由于用的是C++，不太可能会使用fortran，列优先就不管了

如上面注意的地方所说，如果不是计算小块矩阵的话，实际上lda、ldb、ldc和各自的m、n、k相等（注意行优先和列优先）

小块的问题，可见参考网址。

（原）mkl的cblas_sgemm和cblas_dgemm的更多相关文章

（原）mkl用到的函数
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5585301.html 计算 $C=\alpha *A*B+\beta *C$: void cblas_ ...
（原）使用mkl计算特征值和特征向量
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5585271.html 参考文档:mkl官方文档 lapack_int LAPACKE_sgeev(in ...
（原）使用mkl中函数LAPACKE_sgesv计算矩阵的逆矩阵
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/5578027.html 参考文档:mkl的说明文档 lapack_int LAPACKE_sgesv(i ...
Intel MKL函数之 cblas_sgemm、cblas_sgemm_batch
cblas_sgemm int m = 40; int k = 20; int n = 40; std::vector<float> a(m*k, 1.0); std::vector< ...
从 SVM 到多核学习 MKL
SVM是机器学习里面最强大最好用的工具之一,它试图在特征空间里寻找一个超平面,以最小的错分率把正负样本分开.它的强大之处还在于,当样本在原特征空间中线性不可分,即找不到一个足够好的超平面时,可以利用核 ...
cblas_sgemm cblas.h
BLAS(Basic Linear Algebra Subprograms)库,是用Fortran语言实现的向量和矩阵运算库,是许多数值计算软件库的核心, 但也有一些其它的包装, 如cblas是C语言 ...
UBUNTU 16.04 + CUDA8.0 + CUDNN6.0 + OPENCV3.2 + MKL +CAFFE + tensorflow
首先说一下自己机子的配置 CPU:Intel(R) Core(TM) i5-5600 CUP @3.20GHz *4 GPU : GTX 1060 OS : 64bit Ubuntu16.04LTS ...
VS2019配置MKL教程(Windows)
下载链接:https://software.intel.com/en-us/mkl 1.文件下载官网注册后,选择MKL下载下来,安装到指定目录就行,不在多说. 2.配置文件首先创建一个Window ...
MKL库矩阵乘法
此示例是利用Intel 的MKL库函数计算矩阵的乘法,目标为:$C=\alpha*A*B+\beta*C$,由函数cblas_dgemm实现: 其中$A$为$m\times k$维矩阵,\ ...

随机推荐

Floyd最小环
本文转自这里最小环:从一个点出发,经过一条简单路径回到起点成为环.图的最小环就是所有环中长度最小的. 怎样求最小环呢? 1传统的解决方法(dijkstra): 任意一个最小环环的权值, ...
Session与Cookie间不得不说的一些事
在很久很久以前,刚有浏览器和网页的时候,web开发者发现了一个问题,我必须要在客户端这边保存一些东西才能实现某些功能,比如大家喜闻乐见的购物车.用户登录.自动登陆等.但是客户端只有一个浏览器,怎么在用 ...
CString 字符串转化和分割
1.格式化字符串 CString s;s.Format(_T("The num is %d."), i);相当于sprintf() 2.转为 int 转10进制最好用_ttoi() ...
java 根据时间生成唯一id
主要是依据当前系统毫秒数,但若用循环测试,同一毫秒依然会循环很多次, 系统毫秒数是13位, 公司的解决方法是再加5位的自增数,从00001开始, 于是登录淘宝查看,淘宝的id是13位的数字,猜测应该是 ...
Xshell4连接Linux后 win快捷键锁屏
今天在使用Xshell连接CentOS后使用Vim编辑器编辑完后习惯性的按了Ctrl+S 然后按什么都不起作用只能重新连接通过查资料得知 Ctrl + S 是Linux 锁屏的快捷键要解除锁 ...
Liunx+C编程一站式学习
Liunx+C编程一站式学习这本书有什么特点?面向什么样的读者?这本书最初是为某培训班的嵌入式系统Linux工程师就业班课程量身定做的教材之一.该课程是为期四个月的全日制职业培训,要求学员毕业时具备非 ...
C之函数指针
这方面的技能,在观察系统调用时,是很需要的. 但我不是很熟悉,另外,要再会函数指针数组的话,那就更强啦~~ 按<HEAD FIRST C>作了个样例: cat find.c #includ ...
KMP算法总♂结
讲KM♂P算法之前,我们先讲一个故♂事. 有一天,sgg给了老obo一封信和一个单词,并给他一个任务:找出这封信出现了多少个单词,然后在规定时间内告诉他. 碰到这个问题,老obo会怎么做呢? 首先最直 ...
WEB打印插件jatoolsPrinter
为什么选择 jatoolsPrinter 免费版? 支持无预览直接打印真正免费,不加水印,没有ip或域名限制,不限时间,兼容ie6+ 无须注册,下载即用提供经过微软数字签名的cab自动安装包,安装 ...
postGreSQL数据库部署及简单使用
1,deployByRuiyIns rpm -ivh http://yum.postgresql.org/9.4/redhat/rhel-6-x86_64/pgdg-centos94-9.4-1.no ...

（原）mkl的cblas_sgemm和cblas_dgemm

（原）mkl的cblas_sgemm和cblas_dgemm的更多相关文章

随机推荐

热门专题