整理AI性能指标

Sorting out AI performance metrics

推理性能的最佳衡量标准是什么?

在人工智能加速器的世界里,对于给定的算法,芯片的性能经常以每秒万亿次的运算量(TOPS)来表示。但有许多原因说明,这可能不是最好的数据。

“客户真正想要的是每美元的高吞吐量,”人工智能加速器公司FlexLogix的首席执行官GeoffTate说。

Tate解释说,拥有更多的tops并不一定与更高的吞吐量相关。在batch size批量大小为1的边缘应用程序中尤其如此。数据中心之类的应用程序可以通过使用较大的批处理并行处理多个输入来提高其吞吐量(因为有备用的顶部),但这通常不适合边缘设备。

例如,Tate将Flex Logix’ InferX X1设备与市场领先的GPU设备进行了比较。虽然GPU提供了3到4倍的吞吐量,最高10倍,但使用的dram数量是8倍。Tate认为这使得flexlogix的架构更具资源效率。

Tate提出的每美元吞吐量指标听起来很合理,但实际上,要找到可靠的产品成本信息来进行直接比较并不容易。诸如需要多少DRAM,或者某个芯片有多少硅面积等因素可以作为成本的指标,可惜不是精确的。

Flex Logix的InfereX X1设备将于2019年年底前投产。将提供大约8.5个top。

ResNet-50公司

TOPS作为度量标准的另一个问题是,通常在运行ResNet-50时进行度量。

Tate说:“ResNet-50不是客户关心的基准,但是人报告最多的一个。“不太相关的原因是使用了非常小的图像。”

如今,ResNet-50在很大程度上被视为过时,已经存在了一段时间,已经成为引用顶级数据的事实标准。有充分的理由继续使用作为一个标准;其中包括努力保持所有分数至少在一定程度上具有可比性,以及使这一事实上的标准对所有类型的设备(即使是很小的设备)都可用。然而,不足以真正挑战当今为数据中心推理而构建的巨大芯片,也不足以炫耀能力。

行业基准

除了事实上的标准,当然还有各种各样的组织在为人工智能加速器开发基准(参见:MLPerf、DawnBench、EEMBC等)。

虽然MLPerf已经发布了推断结果,但Tate认为这个基准过于面向数据中心。在这个场景中,认为在第90个时间段,一个设备的延迟是一个性能指标。

“在边缘,我认为顾客不想知道第90个百分位,想知道第100个百分位。想知道:能保证我什么?Tate说,将自动驾驶作为一种边缘应用,在这种应用中延迟非常关键。

在更复杂的图像处理任务(如目标检测)上的性能更适合于比较当今高端的人工智能加速器

当信息在多个处理器内核和内存之间传输时,长尾延迟对于那些遭受总线争用的系统来说是一个典型的问题。虽然现在的许多设备使用高带宽内存接口,但在可能发生争用的情况下,理论上仍然存在延迟。

flexlogix基于FPGA的推理处理器设计每次都有完全相同的延迟(Groq也声称这一点,尽管坚称自己的设备不是FPGA)。

“由于我使用的是我的共同创始人在核心发明的FPGA互连,因此从内存到乘法累加器,到激活逻辑,再到内存,都有一条完全专用的路径。所以没有争议:事情就是这样。Tate说:“我的利用率不是百分之百,但我的利用率比其所有体系结构都要高得多。”。

市场

对于这一领域芯片初创公司数量的激增,泰特对FlexLogix的前景持乐观态度。

“当芯片投入使用,软件运行,展示演示,当看到价格和力量……很快,那些不在上四分之一的公司就会消失。”。

泰特的预测是,根据不同的细分市场(训练、推理、数据中心、edge、超低功耗等),这一领域可以支持10或15种芯片产品。今天提供的产品在计算能力方面跨越了多个数量级,因此并不都是直接相互竞争的。

泰特提到沃伦•巴菲特的名言:“在未来的一两年里,将有一场大规模的牛群淘汰,当潮水退去时,可以看到谁在裸泳。”

整理AI性能指标的更多相关文章

  1. 最近整理AI相关感想

    前言 目前笔者致力于 在AI 开发研究,四大平台里,百度AI 提供 的开发者资料是最全,开发的友好度也是最高的,很多都已经集成在SDK中,支持许多语言体系. 其实 作为公司层面的考虑,针对技术的研究出 ...

  2. 带你从0到1开发AI图像分类应用

    摘要:通过一个垃圾分类应用的开发示例,介绍AI Gallery在AI应用开发流程中的作用. 本文分享自华为云社区<AI Gallery:从0到1开发AI图像分类应用>,作者: yd_269 ...

  3. 2.5星|《AI进化论》:疑似基于PPT与公关稿整理汇编而成

    AI进化论·解码人工智能商业场景与案例 全书是目前AI在一些热门领域的应用的介绍,包括各行业内AI可以实现的功能.现有相关公司的具体业务等.对各公司的介绍仅限于能实现什么业务,具体做的怎么样,有什么优 ...

  4. AI 玩法整理

    随着信息技术的火热发展,人工智能已经成为IT全行业的风口爆发点,既然风口来了,作为技术人人员也都毫不犹豫的分一杯羹,怎么玩呢? 接下来的博客就会带领大家一起玩玩AI 认识AI--略,如果有需要的可以再 ...

  5. ps和AI使用过程中的易错点整理

    ps:1.视图工具:1)标尺2)参考线3)网格:视图-->--显示>-->网格4)修改网格:编辑-->首选项>-->参考线.网格和切片 5)放大工具:画布中单击可放 ...

  6. 【总结整理】AI产品经理大会2017(转载)

    从企业大数据到企业 AI | 易观智慧院院长 李智 1.AI 不是目的,而是要了解 AI 是什么,真正意义上的强人工智能在前沿领域尚未取得突破,暂时只能在影视文学作品中去思考人机关系.机器人三定律在未 ...

  7. 5G和AI会碰撞出什么样的火花呢?

    本文学习和分享一篇综述文章,这篇文章是东南大学移动通信国家重点实验室主任.长江学者特聘教授尤肖虎教授2019年发表在<中国科学 信息科学>(<SCIENCE CHINA Inform ...

  8. 马里奥AI实现方式探索 ——神经网络+增强学习

    [TOC] 马里奥AI实现方式探索 --神经网络+增强学习 儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典 ...

  9. 五子棋AI清月连珠开源

    经过差不多两年的业余时间学习和编写,最近把清月连珠的无禁手部分完善得差不多了.这中间进行了很多思考,也有很多错误认识,到现在有一些东西还没有全面掌握,所以想通过开源于大家共同交流. 最近一直发表一些五 ...

随机推荐

  1. UVA10340子序列

    题意:       给你两个串,问你第二个第一个串是否是第一个串删除0个或多个字母得到的? 思路:       直接模拟就行了,在第二个串中去按顺序更新第一个串的下标,好像没说明白啊,不管了,水题,不 ...

  2. IDS入侵检测系统

    目录 IDS入侵检测系统 入侵检测系统的作用 入侵检测系统功能 入侵检测系统的分类 入侵检测系统的架构 入侵检测工作过程 数据检测技术 误用检测 异常检测 IDS的部署 基于网络的IDS 基于主机的I ...

  3. Django中的模型(操作数据库)

    目录 Django配置连接数据库 在Django中操作数据库 原生SQL语句操作数据库 ORM模型操作数据库 增删改查 后台管理 使用后台管理数据库 模型是数据唯一而且准确的信息来源.它包含您正在储存 ...

  4. [CTF]培根密码

    [CTF]培根密码 ---------------------  作者:adversity`  来源:CSDN  原文:https://blog.csdn.net/qq_40836553/articl ...

  5. pr加字幕

    选择免费字体 自由字体整理了免费的商用字体 安装字体 将下载好的.ttf文件,右键选择为所有用户安装 如果没有选择为所有用户安装,你在Arctime或者premiere中可能无法找到这个字体 而且想要 ...

  6. 还不懂 redis 持久化?看看这个

    Redis 是一个内存数据库,为了保证数据不丢失,必须把数据保存到磁盘,这就叫做持久化. Redis 有两种持久化方法: RDB 方式以及 AOF 方式 RDB 持久化 前言 RDB持久化把内存中的数 ...

  7. Docker——安装部署

    前言 从 2017 年 3 月开始 docker 在原来的基础上分为两个分支版本: Docker CE 和 Docker EE. Docker CE 即社区免费版,Docker EE 即企业版,强调安 ...

  8. ipmitool使用手册(20200401)

    ipmitool使用手册原创xinqidian_xiao 最后发布于2018-07-05 12:15:47 阅读数 17579 收藏展开一.查找安装包 查看ipmitool属于哪个安装包 #yum p ...

  9. Ansible_创建角色_role

    一.创建角色目录结构 1.角色创建流程 1️⃣:在Ansible中创建角色不需要特别的开发工具.创建和使用角色包含三个步骤: 创建角色目录结构 定义角色内容 在playbook中使用角色 2.角色目录 ...

  10. 063.Python前端Django分页器

    Django的分页器 1 前期准备 创建一个数据库,用于存放数据 mysql> create database pager default charset=utf8; mysql> use ...