AI芯片体系结构目标图形处理

AI chip architecture targets graph processing

可编程图形流处理器(GSP)能够执行“直接图形处理、片上任务图管理和执行以及任务并行性”。设计GSP是为了满足人工智能处理的需求,而这些需求以前是GPU、CPU或DSP无法满足的。

GSP体系结构由一系列图形流处理器、专用数学处理器、硬件控制和各种类型的数据缓存组成。GSP可以提供:“真正的任务级并行,最小限度地使用片外存储器,深度优先的硬件图形调度,完全可编程的体系结构。”

图形计算

虽然人工智能有许多不同类型的神经网络,所有的神经网络都是基于图形的,这允许开发人员利用图形原生结构在单个架构上构建多个神经网络和整个工作流。

然而,在图形计算领域,人工智能处理中需要“数据流图的优化和编译”。

GSP声称在三个方面与其他基于图形的数据流处理器有所不同。

首先,“完全可编程的”,能够执行“广泛的任务”。

其次,它是“动态可编程的……在一个时钟周期内”

第三,“提供流媒体的集成”,这使得最小化延迟成为可能。这种巨大的效率倍增器是通过“数据流机制”实现的,在这种机制中,非计算性数据移动被最小化或消除。

GSP体系结构的图形本机特性可以最小化数据在外部DRAM之间的来回移动。外部只需要第一个输入和最终输出,而中间的其他数据只是临时的中间数据。这将大大减少内存带宽和功耗。

在芯片、板和系统级别上尽可能降低延迟、减少内存需求和能源需求。

试点项目的经验教训

通过尽早推出GSP嵌入式桌面设备,“我们获得了进入真正客户及其工作负载需求的入场券。”

通过这些试点,基于GSP的平台有更多的应用程序和细分市场。其普惠制解决的市场范围从汽车和智能视觉(监视)到企业计算。

GSP可以满足从云中的数据中心到收集数据的边缘的所有地方施加的较低的能量限制。

GSP的驱动力正在迅速改变深度学习技术,包括新的拓扑、神经网络和算法。如此快节奏的技术进步常常促使客户希望芯片能做XYZ。这就是完全可编程的GSP架构发挥作用的地方。

例如,在汽车领域,GSP将应用于智能远程信息处理、ADAS、驾驶员监控和乘客评估。关键是许多汽车应用的单一GSP体系结构。

例如,单芯片可以结合激光雷达传感器输入和点云进行ISP处理、语义分割和传感器融合。这是通过视频目标检测和激光测距两个并行执行的数据流图来实现的。

由于GSP的主要市场是汽车(汽车客户总是要求确定性),GSP架构是“确定性的”。

最终开发了一个名为“Blaize NetDeploy”的工具。许多客户已经花了数周时间在优化GPU上经过训练的人工智能模型,并将其转换为在推理机上部署。一个软件工具,可以加速量化、修剪和压缩神经网络的过程。

AI芯片体系结构目标图形处理的更多相关文章

  1. AI芯片结构目标图形处理

    AI芯片结构目标图形处理 AI chip architecture targets graph processing 东京--AI处理器设计师Blaize,原名ThinCI(发音为"Thin ...

  2. AI芯片:高性能卷积计算中的数据复用

    随着深度学习的飞速发展,对处理器的性能要求也变得越来越高,随之涌现出了很多针对神经网络加速设计的AI芯片.卷积计算是神经网络中最重要的一类计算,本文分析了高性能卷积计算中的数据复用,这是AI芯片设计中 ...

  3. 十大热门AI芯片

    资料来源:头条<人工智能影响力报告>中的人工智能十大热门芯片 iPhone X内部搭载了一颗全新定制的处理器——A11 Boinic,用来承担人脸识别和移动支付的工作负荷.双核心A11芯片 ...

  4. 深度 | AI芯片终极之战

    深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn= ...

  5. 人工智能AI芯片与Maker创意接轨(下)

    继「人工智能AI芯片与Maker创意接轨」的(上)篇中,认识了人工智能.深度学习,以及深度学习技术的应用,以及(中)篇对市面上AI芯片的类型及解决方案现况做了完整剖析后,系列文到了最后一篇,将带领各位 ...

  6. 深度 | AI芯片之智能边缘计算的崛起——实时语言翻译、图像识别、AI视频监控、无人车这些都需要终端具有较强的计算能力,从而AI芯片发展起来是必然,同时5G网络也是必然

    from:https://36kr.com/p/5103044.html 到2020年,大多数先进的ML袖珍电脑(你仍称之为手机)将有能力执行一整套任务.个人助理将变的更加智能,它是打造这种功能的切入 ...

  7. 一文看懂AI芯片竞争五大维度

    下一波大趋势和大红利从互联网+让位于人工智能+,已成业界共识.在AI的数据.算法和芯片之三剑客中,考虑到AI算法开源的发展趋势,数据与芯片将占据越来越重要的地位,而作为AI发展支柱的芯片更是AI业的竞 ...

  8. 一文解读AI芯片之间的战争 (转)

    2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...

  9. 比特大陆发布终端 AI 芯片 端云联手聚焦安防

    雷帝网 乐天 10月17日报道 比特大陆今日正式发布终端人工智能芯片BM1880,一同发布的还有基于云端人工智能芯片 BM1682 的算丰智能服务器 SA3.嵌入式AI迷你机 SE3.3D 人脸识别智 ...

随机推荐

  1. 病毒木马查杀实战第021篇:Ring3层主动防御之编程实现

    前言 我们这次会依据上次的内容,编程实现一个Ring3层的简单的主动防御软件.整个程序使用MFC实现,程序开始监控时,会将DLL程序注入到explorer.exe进程中,这样每当有新的进程创建,程序首 ...

  2. POJ 1386 欧拉路的判定

    题意:       给你n个单词,问你有没有一种排列方式可以所有单词的首部是相邻单词的尾部. 思路:       这个题目还挺基础的,就是个欧拉的判定,首先对于每一个单词,我们把他抽象成边,每个单词两 ...

  3. DVWA之SQL Injection

    SQL Injection SQL Injection,即SQL注入,是指攻击者通过注入恶意的SQL命令,破坏SQL查询语句的结构,从而达到执行恶意SQL语句的目的.SQL注入漏洞的危害是巨大的,常常 ...

  4. LA3644简单并查集判环

    题意:       有n个化合物,每个化合物是两种元素组成,现在要装车,但是一旦车上的化合物中的某几个化合物组成这样一组关系,有n个化合物正好用了n中元素,那么就会爆炸,输入的顺序是装车的顺序,对于每 ...

  5. hdu5108枚举因子求最小的m

    题意:      给一个n(<=10Y),然后让找到一个最小的m使得n/m是一个素数. 思路:       先用sqrt(n)的时间把所有的因子都求出来,然后在排序,枚举,就行了,这个题目这么做 ...

  6. 学生免费使用JetBrains全家桶

    今天又有一个同学来问我申请流程,因此也就趁着这个机会把整个流程简单地记录一下,供大家分享.下面所提及到的学校邮箱以及相关的操作都是以自己学校为准,学校不同可能会稍有不同,大家按自己学校的操作就好. 学 ...

  7. 开箱即用的Vite-Vue3工程化模板

    开箱即用的Vite-Vue3工程化模板 前言 由于临近毕业肝毕设和论文,停更有一段时间了,不过好在终于肝完了大部分内容,只剩下校对工作 毕设采用技术栈Vue3,Vite,TypeScript,Node ...

  8. .Net·快速查找哪一个类库引用了哪一个Package

    阅文时长 | 0.18分钟 字数统计 | 348.8字符 主要内容 | 1.引言&背景 2.查找法示例 3.声明与参考资料 『.Net·快速查找哪一个类库引用了哪一个Package』 编写人 ...

  9. 『政善治』Postman工具 — 13、Postman接口测试综合练习

    目录 (一)项目接口文档 1.鉴权接口 2.注册接口 3.登录接口 4.用户信息接口 5.注销接口 (二)网站上手动验证 (三)Postman测试实现 1.准备工作 (1)创建一个Collection ...

  10. 【转载】CentOS 7自动以root身份登录gnome桌面 操作系统开机后自动登录到桌面 跳过GDM

    CentOS 7自动以root身份登录gnome桌面 ################### #cd /etc/gdm ]# cat custom.conf# GDM configuration st ...