从今天开始记录学习sharc dsp过程中的点点滴滴吧。

 

DPI:Digital Peripheral Interface

DAI:Digital Audio Interface

 

SHARC SIMD Core

SIMD 单指令多数据

ADSP-2148x包含两个用作单指令、多数据(SIMD)引擎的计算处理器元件,分别称为PEX和PEY,各元件均由ALU、乘法器、移位器和寄存器文件组成。

PEX始终有效,PEY可通过将MODE1寄存器的PEYEN模式位设为1来使能。SIMD模式允许处理器在两个处理元件中执行同一指令,但各处理元件处理不

同的数据。这种架构对于执行计算密集型DSP算法非常有效

 

SIMD Enabled:

When any computation or data access is executed, it will be performed automatically in both processing elements

F0 = F1 + F2; explicitly defined in source code Will execute in PEx

S0 = S1 + S2; implicit operation not defined in source code Will be automatically executed in PEy in the same instruction cycle

 

SIMD Disabled (SISD Mode):

Only the explicit instruction will be executed in PEx

 

PM地址总线的宽度 = 24bits 。可最多访问16Mbit的程序/数据。

PM数据总线的宽度 = 48bits。 用以存取48 位字长的指令,当用来存放数据时,32 位单精度浮点数或32位定点数将位于48 位的高32 位中

 

48位指令字支持各种并行操作,可实现简练编程。例如,处理器可以有条件地在两个处理元件中执行乘法、加法和减法,同时进行分支并从存储

器获取最多4个32位数据值,所有这些只需一个指令。

 

 

 

 

汇编程序分析(FIR)

#include    "def21364.h"                    /* Symbol Definition File */

#define     TAPS    64                        /* length of filter */
#define     N       128                        /* number of samples */

.extern    ss_fir;

/* DM data */
.section/dm seg_dmda;                      /* Segments are declared in the .ldf file*/
.ALIGN 2;                                         /* Set alignment to long-word boundary for next variable */
.var    dline[TAPS+1];                        /* delay line compensate for circ buffer, see comments in SS_FIR.asm */
.ALIGN 2;
.var    input[N] = "input.dat";            /* array of samples */

/* PM data */
.section/dm seg_pmda;
.ALIGN 2;
.var    coeffs[TAPS] = "ssfcoeffs.dat";        /* Filter coefficients */
.ALIGN 2;
.var    output[N];                                    /* Output array */

/* PM interrupt vector code */
.section/pm   seg_rth;
Reserved_1:     rti; nop; nop; nop;
Chip_Reset:     idle; jump start; nop; nop;

/* program memory code */
.segment/pm seg_pmco;

start:
/*--------------------- Setup modify registers for arrays --------------------*/
    m1 = 1;
    m2 = -1;
    m3 = 2;

      m9 = 2;
    m10= 1;
/*----------------------------------------------------------------------------*/

 

/*--------------------- Initialization delay line ----------------------------*/
    b0 = dline;
    l0 = @dline-1;

    f8=0.0;
    lcntr = TAPS, do clear_fir until lce;
clear_fir:  dm(i0,m1) = f8;

    i0 = dline;
/*----------------------------------------------------------------------------*/

 

/*-------------- Setup DAGs for input/output/coeffs and call ss_fir ----------*/
    r3 = TAPS;
    r3 = lshift r3 by -1;                     /* r3 = taps/2 due to SIMD mode */
    r0 = 3;                                      /* 3 macs outside of fir mac loop */
    r3 = r3 - r0;                              /* r3 = taps/2 - 3 for fir mac loop counter */
   
    b1 = input;
    l1 = 0;

    b9 = output;
    l9 = 0;

    b8 = coeffs;
    l8 = @coeffs;
   
lcntr = N, do fir_loop until lce;
            call ss_fir (db);                /* Call fir */
            f0 = dm(i1,m1);              /* Read one sample */
            nop;                              /* Call can't be in last three locations of a loop */
fir_loop:    pm(i9,m10)=f8;          /* Write result to output */
/*----------------------------------------------------------------------------*/
 
     

/* Terminate and wait */
wait1:    idle;
        jump wait1;

 

 

#include    "def21364.h"                /* Symbol Definition File */

.global ss_fir;

/* program memory code */
.section/pm seg_pmco;

ss_fir:
    bit set MODE1 CBUFEN;               /* Circular Buffer Enable, one cycle effect latency */
    nop;                                          /* Circular Buffering not in effect until next cycle */
   
    s0 = dm(i0, m1);                        /* move pointer to delay[1] */
   
    bit set MODE1 PEYEN;                 /* SIMD Mode Enable, one cycle effect latency */
    s0 = dm(i0, m2);                        /* load s0 with the value of delay[1] for SIMD store, move pointer to delay[0] */
   
    dm(i0,m3)=f0, f4 = pm(i8,m9);    /* transfer sample to delayline, done in SIMD to load end of buffer + 1 */
                                                     /* to compensate for circular buffer issue described above, read 2 coeffs */                                       

        f8=f0*f4, f0=dm(i0,m3), f4=pm(i8,m9);                          /* samples * coeffs, read 2 samples, read 2 coeffs */
        f12=f0*f4, f0=dm(i0,m3), f4=pm(i8,m9);                        /* samples * coeffs, read 2 samples, read 2 coeffs */
        lcntr=r3, do macs until lce;                                             /* FIR loop */
macs:f12=f0*f4, f8=f8+f12, f0=dm(i0,m3), f4=pm(i8,m9);       /* samples * coeffs, accum, read 2 samples, read 2 coeffs */
        f12=f0*f4, f8=f8+f12, s0=dm(i0,m2);                            /* samples * coeffs, accum, dummy read to move pointer to oldest sample */
        f8=f8+f12;                                                                   /* final SIMD accum */
        r12=s8;                                                                       /* move PEy total into PEx register file */
       
    rts (db);
    bit clr MODE1 CBUFEN | PEYEN;                                         /* Circular Buffer Disable, SIMD Mode Disable */
    f8=f8+f12;                                                                      /* last accum */

 

dline的读写

红色表示进入macs 循环前 i0指针指向的位置。

 

该程序使用了循环寻址的方式

Bx、Lx、Ix 三个寄存器的序号x 必须一致,而Mx 寄存器可以在同一个DAG 组中任意选取

R3 = lshift R3 by -1;  //右移1bit

sharc dsp 学习记录1---2014-07-30的更多相关文章

  1. C语言学习记录_2019.02.07

    C99开始,可以用变量来定义数组的大小:例如,利用键盘输入的变量来定义数组大小: 赋值号左边的值叫做左值: 关于数组:编译器和运行环境不会检查数组下标是否越界,无论读还是写. 越界数组可能造成的问题提 ...

  2. [转]Oracle学习记录 九 Prc C学习

    经过前面的了解,现在想用C语言来编程了,搜索了很多东西,后来决定先用Pro C来进行学习 在安装完Oracle数据库后就可以进行编程了,里面有一个命令proc就是对程序进行预编译的. 在这记一下,这是 ...

  3. Python学习记录day6

    title: Python学习记录day6 tags: python author: Chinge Yang date: 2016-12-03 --- Python学习记录day6 @(学习)[pyt ...

  4. Python学习记录day5

    title: Python学习记录day5 tags: python author: Chinge Yang date: 2016-11-26 --- 1.多层装饰器 多层装饰器的原理是,装饰器装饰函 ...

  5. Matlab 进阶学习记录

    最近在看 Faster RCNN的Matlab code,发现很多matlab技巧,在此记录: 1. conf_proposal  =  proposal_config('image_means', ...

  6. Git学习记录

    一.简要说明 Git是分布式版本控制系统,而非集中式版本控制系统.其优势如下: 自由和开放源码 速度快,体积小 隐式备份(每台用户机上都有一个备份) 安全 不需要强大的硬件 更简单的分支 二.基本概念 ...

  7. Uboot 2014.07 makefile分析 - 其他Cortex系列

    uboot的官网可以通过谷歌搜索得到,显示结果第一个链接就是. 官网:: http://www.denx.de/wiki/U-Boot ftp下载: ftp://ftp.denx.de/pub/u-b ...

  8. 【转】BLE 学习记录

    原文网址:http://m.blog.csdn.net/blog/chiooo/43985401 BLE 学习记录 ANROID BLE 开发,基于 bluetoothlegatt 分析 mBluet ...

  9. 强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)

    强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introductio ...

随机推荐

  1. java线程池如何合理的设置大小

    线程池究竟设置多大要看你的线程池执行的什么任务了,CPU密集型.IO密集型.混合型,任务类型不同,设置的方式也不一样 任务一般分为:CPU密集型.IO密集型.混合型,对于不同类型的任务需要分配不同大小 ...

  2. 你真的懂 ajax 吗?

    前言 总括: 本文讲解了ajax的历史,工作原理以及优缺点,对XMLHttpRequest对象进行了详细的讲解,并使用原生js实现了一个ajax对象以方便日常开始使用. damonare的ajax库: ...

  3. Java的三种代理模式:静态代理/JDK动态代理/Cglib动态代理

    1.静态代理:需要定义接口或者父类,目标对象与代理对象均实现同一接口或继承同一父类. 2.JDK动态代理:需要目标对象实现一个接口,通过动态反射的机制,生成代理对象,实现同一个接口 3.Cglib动态 ...

  4. Maven整合Spring3.0+Mybatis3.2+Struts2.3+查找坐标+jar包依赖(五)

    依赖传递 只添加了一个struts2-core依赖,发现项目中出现了很多jar,这种情况 叫 依赖传递

  5. 为何time_before 起作用【转】

    转自:http://decimal.blog.51cto.com/1484476/410673 Title: jiffies溢出与时间先后比较编制: chinakapok@sina.com日期:200 ...

  6. Asp.Net Core 快速邮件队列设计与实现

    发送邮件几乎是软件系统中必不可少的功能,在Asp.Net Core 中我们可以使用MailKit发送邮件,MailKit发送邮件比较简单,网上有许多可以参考的文章,但是应该注意附件名长度,和附件名不能 ...

  7. uoj#188. 【UR #13】Sanrd(Min_25筛)

    题面 传送门 题解 这是一道语文题 不难看出,题目所求即为\(l\)到\(r\)中每个数的次大质因子 我们考虑\(Min\_25\)筛的过程,设 \[S(n,j)=\sum_{i=1}^nsec_p( ...

  8. yum install oracle-validated

    背景 当时心血来潮要在linux搞oracle,可一顿折腾,大约两个周时间,主要是各种环境的检测麻烦,在redhat上操作也不如centos有利. 命令 yum install oracle-vali ...

  9. Vue.js——常用的指令

    1.v-on:指令监听DOM事件,并在触发时运行一些javaScript代码. <div id='myView'> <img src="img/se.png" v ...

  10. jquery学习集合

    跳转网页:$(location).attr('href', '/index');