ISSCC2024 Computing-In-Memory Session 趋势整理

今天上午ISSCC2024远东区推介会,主要关注了一下Computing-In-Memory Session。CIM今年被放在了Session 34,会上主持人透露CIM方向一共投稿了50篇,最后录用了9篇,算下来录用率不到20%,不得不感慨一句相当之卷。

言归正题,以下是今年CIM Session录取的9篇论文:

两篇亮点文章:

接下来是我的初步分析和整理。

  1. 存储介质

    从存储介质的角度来说,9篇文章有5篇是纯SRAM(34.1 & 34.3-6),34.2虽然也是纯CMOS,但存储用的是更少晶体管的Gain Cell,34.9则是在工艺上做了Flash和SRAM的集成。剩下两篇中34.7是eDRAM,34.8是RRAM。

    整体上来看SRAM CIM仍然是大头,RRAM和eDRAM也是CIM常客不表,34.9在14nm FinFET工艺上做了Flash存储,并结合了Flash CIM和SRAM CIM,感觉很novel,34.2使用了Gain Cell,大概了解了一下这是一种纯晶体管无电容的DRAM Cell,可以参考这篇文章,虽然相比SRAM需要动态刷新,但有更高的存储密度,也是第一次在CIM中见到使用这个的。

  2. 存算类型

    Digital CIM一共四篇,分别是34.1,34.2,34.6和34.8,占据半壁江山。

    Analog CIM一共三篇,分别是34.5,34.8,34.9,看似与Digital不遑多让,但考虑到34.8是RRAM CIM,34.9是SRAM+Flash的特殊工艺,两者因为工艺器件的原因自然的选择了Analog,整体上来看如果是标准逻辑工艺,Digital仍然是大势。

    有趣的是,剩下有两篇结合了Digital和Analog的Hybrid CIM,34.3和34.6。其中34.6就是笔者的论文,哈哈。Hybrid CIM的主要目标是探索Analog CIM和Digital CIM这两大主流方向的优势互补。实际上ISSCC2023就有论文提出了Hybrid CIM,今年在这个方向上探索的人略有增加。

  3. 浮点存算

    今年的工作可以显著看到更多人关注浮点CIM,有接近半数的文章是浮点CIM,包括34.1,34.2,34.6,34.8。

    正如之前的博客所说浮点是一个23年就发现的显著趋势,支持浮点运算的CIM因为可以运行更高精度要求的模型,在可支持的应用上也变得更广了,今年大家继续深挖这个技术也是情理之中。

  4. 计算负载

    还有一个有趣的点是34.3和34.5都考虑了对CNN和Transformer两类计算负载的支持。我们都知道CNN和Transformer目前是CV和NLP两个领域各自的SOTA(虽然CNN目前隐隐约约有被ViT干掉的风险),这两类模型在计算方法上大相径庭,怎么在CIM上同时支持两者确实是一个有趣的问题。

最后做个总结,ISSCC作为集成电路的奥林匹克,还是很有风向标作用的,可以通过这个窗口看到围绕CIM这个技术大家一直在持续探索更多的东西,作为一个热点技术,CIM这个领域的竞争还是非常激烈的,今年侥幸能够中上一篇,也算对得起一起奋斗的老师同学了。

如果要谈点感悟的话,那就是博闻强识,触类旁通很重要,仅仅困在一个小领域里很难冒出好的idea,需要多多接触多多学习其他领域的知识,并且勤加思考,举一反三。

ISSCC2024 Computing-In-Memory Session 趋势整理的更多相关文章

  1. Session重点整理

    首先明确几个概念 (1)JSessionID:通过tomcat运行的Java项目,为新用户生成的随机字符串.(应该是tomcat设置的,我没试过别的服务器,如有错误请指正) (2)Session请求( ...

  2. Introduction to Parallel Computing

    Copied From:https://computing.llnl.gov/tutorials/parallel_comp/ Author: Blaise Barney, Lawrence Live ...

  3. 【转载】Redis 4.0 自动内存碎片整理(Active Defrag)源码分析

    click原文链接原文链接:https://blog.csdn.net/zouhuajianclever/article/details/90669409阅读本文前建议先阅读此篇博客: Redis源码 ...

  4. sqlalchemy之create_engine和session

    sqlalchemy之create_engine和session orm 实质上,一个O/R Mapping会为你生成DAL.(即为数据访问层(Data Access Layer).其功能主要是负责数 ...

  5. Elasticsearch基础知识要点QA

    前言:本文为学习整理实践他人成果的记录型博客.在此统一感谢各原作者,如果你对基础知识不甚了解,可以通过查看Elasticsearch权威指南中文版, 此处注意你的elasticsearch版本,版本不 ...

  6. client-server model peer-to-peer architecture 主从式架构

    w https://zh.wikipedia.org/wiki/主从式架构 主从式架构 (Client–server model) 或客户端-服务器(Client/Server)结构简称C/S结构,是 ...

  7. ElasticSearch详解与优化设计

    简介 概念 安装部署 ES安装 数据索引 索引优化 内存优化 1简介 ElasticSearch(简称ES)是一个分布式.Restful的搜索及分析服务器,设计用于分布式计算:能够达到实时搜索,稳定, ...

  8. iOS 视图控制器转场详解

    iOS 视图控制器转场详解 前言的前言 唐巧前辈在微信公众号「iOSDevTips」以及其博客上推送了我的文章后,我的 Github 各项指标有了大幅度的增长,多谢唐巧前辈的推荐.有些人问我相关的问题 ...

  9. hibernate导入大量数据时,为了避免内存中产生大量对象,在编码时注意什么,如何去除?

    Session session = sessionFactory.openSession(); Transaction tx = session.beginTransaction(); for ( i ...

  10. Deep Learning and the Triumph of Empiricism

    Deep Learning and the Triumph of Empiricism By Zachary Chase Lipton, July 2015 Deep learning is now ...

随机推荐

  1. Wordpress设置必须登录才能查看内容

    参考文章地址 我是一个不会编程的小白,在网上查了好多篇的文章都没有实现这个功能.都是在改完php的代码后,网站就报废了.后来我还是求助了万能的谷歌,找了这篇文章. 上代码.大概猜测了一下,就是判断你现 ...

  2. AtCoder Beginner Contest 187 ABCDE 题解

    A - Large Digits 思路:签到题,读入字符串即可. view code #include<iostream> #include<string> #include& ...

  3. linux cmake 报错 the c compiler identification is unknown

    简介 RT 解决方案 cmake .. -DCMAKE_CXX_COMPILER=/usr/bin/c++ -DCMAKE_C_COMPILER=/usr/bin/gcc 另一个解决方案 也可以通过在 ...

  4. Oracle DBA必备脚本:一条SQL统计Oracle ASH中EVENT、SQL、OBJECT_ID的热点,快速定位性能或故障点

    我们的文章会在微信公众号IT民工的龙马人生和博客网站( www.htz.pw )同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢! 由于博客中有大量代码,通过页面浏览效 ...

  5. API网关如何在iPaaS平台中助企业构建安全高效的API生态体系

    API网关在iPaaS(集成平台即服务)体系中扮演着至关重要的角色,它不仅促进了企业内部系统间的无缝集成,还为构建一个安全.高效且可扩展的API生态系统提供了坚实的基础.通过合理利用API网关的功能特 ...

  6. ETL数据仓库的使用方式

    一.ETL的过程 在 ETL 过程中,数据从源系统中抽取(Extract),经过各种转换(Transform)操作,最后加载(Load)到目标数据仓库中.以下是 ETL 数仓流程的基本步骤: 抽取(E ...

  7. SciTech-EECS-Circuits-Power Electrics(功率器件): 等离子体(电弧:大功率)效应(正负极+数控脉冲放电时间 实现 等离子切割机(逆变式 + 高压引弧式)电解/电镀/电子显微、显像/电火花线切割/特斯拉线圈 ) + WEDM(电火花线切割数控加工)

    SciTech-EECS-Circuits-Power Electrics(功率器件): 特斯拉线圈 : 电(弧)离效应(正负极+数控脉冲放电时间 实现 电解/电镀/电子显微.显像/电火花线切割) + ...

  8. 深度学习入门(10):卷积神经网络(CNN)

    卷积层和池化层的实现 四维数组 from collections import OrderedDict import numpy as np from torch import nn x = np.r ...

  9. _dirname is not defined in ES module scope

    原因是 ESM 中没有全局 __filename,重新定义下它: import path from 'node:path' import { fileURLToPath } from 'node:ur ...

  10. yarn 全局包找不到

    # in ~/.bashrc or equivalent export PATH="$(yarn global bin):$PATH" # for fish-shell: set ...