学习OpenBlas

编译

从OpenBlas Home Page 上下载源代码。make， make install

使用

level 1 向量-向量操作

#include <iostream>

#include "cblas.h"

#include <vector>

int main()

{

    blasint n = 10;

    blasint in_x =1;

    blasint in_y =1;

    std::vector<double> x(n);

    std::vector<double> y(n);

    double alpha = 10;

    std::fill(x.begin(),x.end(),1.0);

    std::fill(y.begin(),y.end(),2.0);

    cblas_daxpy( n, alpha, &x[0], in_x, &y[0], in_y);

    //Print y

    for(int j=0;j<n;j++)

        std::cout << y[j] << "\t";

    std::cout << std::endl;

}

cblas_daxpy实现了求数乘和 y=ax+y 操作。

level 2 矩阵-向量操作

  int i=0;

  double x[2] = {1.0,2.0};

  double y[2] = {2.0,1.0};

  double A[4] = {2.0,4.0,6.0,8.0};

  cblas_dger(CblasColMajor,2,2,10,x,1,y,1,A,2);

  for(i=0; i<4; i++)

      std::cout << A[i] << " ";

  std::cout << std::endl;

cblas_dger实现了 A=αxyT+A 操作。

level 3 矩阵-矩阵操作

  int i=0;

  double A[6] = {1.0,2.0,1.0,-3.0,4.0,-1.0};

  double B[6] = {1.0,2.0,1.0,-3.0,4.0,-1.0};

  double C[9] = {.5,.5,.5,.5,.5,.5,.5,.5,.5};

  cblas_dgemm(CblasColMajor, //列优先

          CblasNoTrans,  CblasTrans,3,3,2,1,A, 3, B, 3,2,C,3);

  for(i=0; i<9; i++)

      std::cout << C[i] << " ";

  std::cout << std::endl;

cblas_dgemm 运行 C=αop(A)op(B)+βC 操作。

附一张blas函数表

參考

-stanford·using OpenBlas

-OpenBlas User Manual

学习OpenBlas的更多相关文章

【神经网络与深度学习】【C/C++】比较OpenBLAS，Intel MKL和Eigen的矩阵相乘性能
比较OpenBLAS,Intel MKL和Eigen的矩阵相乘性能对于机器学习的很多问题来说,计算的瓶颈往往在于大规模以及频繁的矩阵运算,主要在于以下两方面: (Dense/Sparse) Matr ...
[机器学习] 深度学习之caffe1——软件配置与测试
caffe的编译配置真的是很让人头疼啊,不知道试过多少次了~~~ 重装系统了七八次,搞得linux的一些常用命令倒是很熟悉了~~~ 我有洁癖~~~某一个点上出了错,我一定要把它搞好了,再重新来一次,我 ...
MXNet 学习 (1) --- 最易上手的深度学习开源库 --- 安装及环境搭建
安装环境:Win 10 专业版 64位 + Visual Studio 2015 Community. 记录下自己在有GPU的环境下安装配置MXNet的过程.该过程直接使用MXNet release ...
Caffe学习系列(13)：数据可视化环境（python接口)配置
caffe程序是由c++语言写的,本身是不带数据可视化功能的.只能借助其它的库或接口,如opencv, python或matlab.大部分人使用python接口来进行可视化,因为python出了个比较 ...
caffe windows 学习第一步：编译和安装（vs2012+win 64)
没有GPU,没有linux, 只好装caffe的windows版本了. 我的系统是win10(64位),vs 2012版本,其它什么都没有装,因此会需要一切的依赖库. 其实操作系统只要是64位就行了, ...
深度学习框架Caffe的编译安装
深度学习框架caffe特点,富有表达性.快速.模块化.下面介绍caffe如何在Ubuntu上编译安装. 1. 前提条件安装依赖的软件包: CUDA 用来使用GPU模式计算. 建议使用 7.0 以上最 ...
学习笔记TF024:TensorFlow实现Softmax Regression(回归)识别手写数字
TensorFlow实现Softmax Regression(回归)识别手写数字.MNIST(Mixed National Institute of Standards and Technology ...
深度学习框架-caffe安装-环境[Mac OSX 10.12]
深度学习框架-caffe安装 [Mac OSX 10.12] [参考资源] 1.英文原文:(使用GPU) [http://hoondy.com/2015/04/03/how-to-install-ca ...
深度学习框架-caffe安装-Mac OSX 10.12
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px ".PingFang SC"; color: #454545 } p.p2 ...

随机推荐

win7程序关闭后弹出程序兼容性助手这个程序可能安装不正确如果此程序没有正确安装，处理方式
用WTL编写的程序,编译成release后,在win7上关闭后,弹出这个对话框处理方法: 将这个xml文件命名成 xxx.exe.manifest,保存到指定目录下 <?xml version ...
Centos rpm缺少依赖无法安装mysql5.5
rpm -ivh mysql-5.5.22-2.1.i386.rpm --nodeps --force 缺少依赖导致rpm -ivh mysql-5.5.22-2.1.i386.rpm命令无法安装!
multi-threaded copy command - robocopy
we can copy files by the powerful robocopy tool, and it allow copy using muliti-threaded as well. As ...
Linux下nc命来实现文件传输
发送端:cat test.txt | nc -l -p 6666或者nc -l -p 6666 < test.txt 有些版本不要在 -p[监听6666端口,等待连接](设发送端IP为10.20 ...
Hbuilder 常用快捷键汇总
朋友推荐用Hbuilder编辑器,看了下Hbuilder官网和那视频,感觉牛逼哄哄的, 自己也就体验了一下,打开Hbuilder的快捷键列表,每个快捷键都体验了一下,以下展示出来的,每一个都是精华,每 ...
Jenkins持续集成相关文章整理
构建iOS持续集成平台(一)——自动化构建和依赖管理构建iOS持续集成平台(二)——测试框架构建iOS持续集成平台(三)——CI服务器与自动化部署使用Jenkins搭建iOS开发的CI服务器一 ...
packstack安装以及centos源配置注意事项
On CentOS:安装分为四步: 1,$ sudo yum install -y centos-release-openstack-mitaka 2,$ sudo yum update -y 3,$ ...
条款05：了解C++默默编写并调用哪些函数
每一个class都会有一个或多个构造函数.一个析构函数.一个copy assignment操作符.这些控制着基础操作,像是产出新对象并确保它被初始化.摆脱旧对象并确保它被适当清理.以及赋予对象新值. ...
Android——用户登陆及用户名和密码的保存
Android——用户登陆及用户名和密码的保存在之前的学习过程中已经将Android学习完了,但是在后面将近一年的时间里都没有进行过Android开发,所以对Android的所有的知识点又有点忘 ...
HTML5 标准属性 NEW：HTML 5 中新的标准属性。注释：HTML 4.01 不再支持 accesskey 属性：
属性值描述 accesskey character 规定访问元素的键盘快捷键 class classname 规定元素的类名(用于规定样式表中的类). contenteditable true f ...

学习OpenBlas

编译

使用

level 1 向量-向量 操作

level 2 矩阵-向量 操作

level 3 矩阵-矩阵 操作

參考

学习OpenBlas的更多相关文章

随机推荐

热门专题

level 1 向量-向量操作

level 2 矩阵-向量操作

level 3 矩阵-矩阵操作