ARMed解决方案对DSP的战争

ARM体系结构简化了数字信号处理

ARM与数字信号处理(DSP)有什么关系?

  • ARM似乎在处理领域处于领先地位。该处理器已将其视为其最大的细分市场之一,这主要是由于该公司已采取一些措施以适应嵌入式市场及其采用的体系结构。
  • DSP在手机,无绳电话,基站,传呼机,调制解调器,智能手机和PDA(个人数字或数据助手)中普遍采用嵌入式处理器。
  • 利用此类处理器的其嵌入式应用程序包括:磁盘驱动器控制器,汽车引擎控制和管理系统,数字自动环绕声,电视机顶盒和互联网设备。仍在修改其产品以利用:玩具,手表等。可能的应用几乎是无止境的。

但这仍然不能回答问题,为什么要使用ARM处理器来完成这项工作?

  • 答案很简单。ARM可以提供低成本,高性能和低功耗,而要使便携式嵌入式产品在当今世界上可销售,则必须具备上述两种功能。更不用说一个事实,即整个ARM体系结构的专门小组严格致力于充当信号处理器。
  • 这种经过改进的处理器已被命名为“ Piccolo”。Piccolo充当标准ARM微处理器的集成协处理器,允许将第二个面向DSP的数据路径和相关的DSP指令集集成到标准ARM 32位RISC / 16位Thumb系统中。这种配置允许协处理器通过共享相同的单个系统总线来重用数据。这样的系统具有成本效益和功率效率。

Piccolo的这种协处理器情况如何更好地适合DSP?

  • 答案是,在许多方面都有帮助。首先,ARM微处理器与Piccolo的集成通过最小化片上代码存储量并有效利用芯片存储器来减少总硅片面积。如果使用两个独立的处理器,通常不会发现这种情况。
  • 通过结合单周期算术运算和维持该性能所需的数据吞吐量,可以通过指令集集成来提高性能。
  • 阐明为什么Piccolo DSP解决方案具有优势的另一点是,其独立运行的处理器通常基于“传统”技术,这不一定是最好的实现,而与ARM集成则不依赖于不足之处标准。
  • 其重要的优势是可以提高功耗效率,这有助于延长电池寿命并减少热量产生,当然,可以通过集成实现成本节省。两者都有利于支持小型便携式无线产品的强劲趋势。

这种系统是什么样的?

好吧-Piccolo体系结构

左上方显示的是通用寄存器集,所有这些寄存器都可供程序员访问,并包含32个16位寄存器或16个32位寄存器,以最大化piccolo处理器本地的数据存储以及四个扩展精度48位寄存器。在底部是用于输入和输出的缓冲区,以最大程度地减少内存访问以及由于ARM协处理器接口遇到的结构性危害而导致的停顿。

其值得注意的硬件是用于数据快速缩放的32位桶形移位器,16 * 16单周期乘法器,内置对扩展精度算术的支持,以及用于单周期双16位算术和逻辑运算的拆分式ALU。指令字或一个32位数据项算术或逻辑运算。

寄存器具有用于代码优化和灵活性的重新映射方案,并且有四个可嵌套的零开销硬件循环结构用于执行DSP算法。

看起来很简单,不是吗。但是,可能会问一个好问题:ARM协处理器接口如何工作?共享数据的处理器之间不会有很多争论吗?

让从描述协处理器架构本身开始。通过添加硬件协处理器,ARM支持其指令集的通用扩展。

  • 该架构接口最多支持16个逻辑协处理器
  • 每个协处理器最多可以具有16个不限于32位的专用寄存器。
  • 协处理器使用加载/存储架构
  • 为了提高性能,大多数新的ARM将协处理器接口限制在片上使用,以进行缓存和内存管理。

现在让看一下界面。

  • ARM协处理器接口是一个“总线监视”系统。
  • 当协处理器接收指令时,该协处理器通过总线连接到ARM处理器,该指令将数据通过输入缓冲区移动到其自己的内部指令管道。
  • 当协处理器指令开始执行时,ARM和协处理器之间便发生了“握手”,表明都已准备好执行指令。该协议包括三个信号:

1.    Cpi(从ARM到所有协处理器)。

“协处理器指令”的信号,该信号表示ARM已识别出协处理器指令并希望执行。

2.    Cpa(从协处理器到ARM)。

“不存在协处理器”的信号,该信号向ARM指示没有可用的协处理器来执行当前指令。

3.    Cpb(从协处理器到ARM)。

“协处理器繁忙”信号,该信号告诉ARM协处理器尚未开始执行指令。

握手产生了什么结果?这是有趣的部分!

一旦协处理器接收到指令,并且指令正在坐着并等待执行,则根据发生的握手情况有四种可能的结果。

1.    ARM可能不选择执行此指令(不声明cpi),可能是因为落在分支影子内或某些条件测试失败(所有ARM指令均按条件执行)。结果-所有协处理器都放弃指令。

2.    ARM决定执行(声明cpi),但是任何协处理器都无法执行,因此cpa保持活动状态,ARM将采用未定义的指令陷阱并使用软件进行恢复。

3.    ARM决定执行,协处理器接受,但还不能执行。协处理器将CPA调低,但将CPB调高;同时,ARM“忙-等待”直到协处理器将cpb调低,从而使指令流停滞。但是,ARM会中断中断。

4.    ARM决定执行,协处理器接受立即执行。Cpi,cpa和cpb均被拉低,并且双方均致力于完成指令。

特别说明:抢先执行。

只要在握手未完成的情况下协处理器可以恢复状态,协处理器就可以在流水线中接收到指令后立即开始执行指令。

毕竟能说什么?

手机无处不在。而且,为什么呢?因为是如此的便宜,并且很方便携带。但是,这还不是DSP的终结。汽车,电视,微波炉,立体声音响,手表,PDA(等等)都在使用此技术。ARM的Piccolo及其协处理器思想是朝着正确方向迈出的一步。提供了一种在性能,成本和功耗之间取得平衡的架构。在计算机领域,ARM已成为该类别的当前领导者,并取得了短暂的成就。但是,还有更多的事情要来。

ARMed解决方案对DSP的战争的更多相关文章

  1. 利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力

    利用UltraScale和UltraScale+FPGA和MPSOC加速DSP设计生产力 Accelerating DSP Design Productivity with UltraScale an ...

  2. VS 6.00 工程项目文件详解

    *.dsp(DeveloperStudio Project):是VC++的工程配置文件,比如说你的工程包含哪个文件,你的编译选项是什么等等,编译的时候是按照.dsp的配置来的.*.dsw(Develo ...

  3. 一种高灵敏度自带DSP降噪算法的音频采集解决方案

    背景调研   随着AI渗透到各行各业,人们对语音的需求也越来越大,最近一两年,各种AI音频设备如雨后春笋般冒出.各种智能AI设备的推出,意味者市场对低成本的音频采集设备越来越多.针对这种情况,我们开发 ...

  4. 高灵敏度自带DSP降噪算法的audio codec解决方案

    背景调研   随着AI渗透到各行各业,人们对语音的需求也越来越大,最近一两年,各种AI音频设备如雨后春笋般冒出.各种智能AI设备的推出,意味者市场对低成本的音频采集设备越来越多.针对这种情况,我们开发 ...

  5. 基于TI 多核DSP 的大数据智能计算处理解决方案

    北京太速科技有限公司 大数据智能计算,是未来的一个发展趋势,大数据计算系统主要完成数据的存储和管理:数据的检索与智能计算. 特别是在智能城市领域,由于人口聚集给城市带来了交通.医疗.建筑等各方面的压力 ...

  6. Atitit 在线支付系统功能设计原理与解决方案 与目录

    Atitit 在线支付系统功能设计原理与解决方案 与目录 1.1. 支付系统1 1.2. 独立的支付子体系..微服务架构..1 1.3. 参考书籍1 支付战争 [The PayPal Wars:Bat ...

  7. Nordic Semiconductor nRF52832 蓝牙智能多协议单芯片解决方案荣获《中国电子商情》编辑选择奖

    挪威奥斯陆 – 2016年4月11日 – Nordic Semiconductor ASA (OSE: NOD) 赢得<中国电子商情>颁发的"2015年编辑选择奖",其 ...

  8. dsp与sem的互补以及技术实现

    SEM翻译过来叫搜索引擎营销,个人认为是随着搜索引擎竞价排名出现的一个行业,已经有了好多年的历史,做sem的公司这些年里手里应该都积攒着大量的cookie,关键词等与SEM和追踪相关的数据,这些数据现 ...

  9. DSP\BIOS调试Heaps are enabled,but not set correctly

    转自:http://blog.sina.com.cn/s/blog_735f291001015t9i.html Heaps are enabled, but the segment for DSP/B ...

随机推荐

  1. hdu1305 字典树水题

    题意:      给你一些字符串,然后问你他们中有没有一个串是另一个串的前缀. 思路:       字典树水题,(这种水题如果数据不大(这个题目不知道大不大,题目没说估计不大),hash下也行,把每个 ...

  2. OD调试程序常用断点大全

    常用断点  拦截窗口:  bp CreateWindow 创建窗口  bp CreateWindowEx(A) 创建窗口  bp ShowWindow 显示窗口  bp UpdateWindow 更新 ...

  3. Tomcat反序列化漏洞(CVE-2016-8735)

    目录​​​​​​​ CVE-2016-8735 漏洞复现 漏洞修复: CVE-2016-8735 漏洞描述: 该漏洞与之前Oracle发布的 mxRemoteLifecycleListener 反序列 ...

  4. Intel汇编程序设计-整数算术指令(中)

    7.3  移位和循环移位的应用 7.3.1  多双字移位 要对扩展精度整数(长整数)进行移位操作,可把它划分为字节数组.字数组或双字数组,然后再对该数组进行移位操作.在内存中存储数字时通常采用的方式是 ...

  5. 浅谈src与href的区别

    src 和 href 都是用来引入外部资源的属性,例如:图片.视频.CSS 文件.JavaScript 文件等. 那么它们两者之间究竟有什么样的区别呢? <link href="sty ...

  6. gitlab + php自动部署

    功能简介 本地往服务器推送代码之后,触发web钩子,服务器拉取刚刚推送的代码 步骤 1.在gitlab后台配置钩子 项目->编辑项目->Web钩子->新增钩子 2.在服务器端为www ...

  7. window系统搭建医药后台系统

    软件准备: mysql版本: 5.7 jdk版本:1.8 tomcat版本: 9.0 mysql:5.7 第一步:新建Mysql连接   新建Mysql连接 第二步:新建数据库   新建数据库 第三步 ...

  8. TLB和CPU缓存

    TLB 如果每次应用程序访问一个线性地址都需要先解析(查PDT,PTT)那么效率十分低,为了提高执行效率CPU在CPU内部建立了一个TLB表,此表和寄存器一样访问速度极高.其会记录线性地址和物理地址之 ...

  9. input type

    input的type有: text 文本输入 password密码输入 file选择文件 radio单选按钮 checkbox复选按钮 submit对应form的action按钮 button 普通按 ...

  10. 普里姆(Prim)算法

    概览 普里姆算法(Prim算法),图论中的一种算法,可在加权连通图(即"带权图")里搜索最小生成树.即此算法搜索到的边(Edge)子集所构成的树中,不但包括了连通图里的所有顶点(V ...