今天下午ISSCC 2025发布会开完,CIM Session花落谁家终于清楚了。今年CIM被放到了Session 14,共录取七篇,投稿数如果和去年差不多的话,那么录取率应该是进一步下降了(去年录取了九篇)。只能说体感上来说就明显越来越卷。

还是先来看一下录取的Paper:

7篇都来自远东,两篇台湾,五篇大陆,东南大学一己之力贡献3篇,非常牛逼。当然两篇highlight仍然是属于台湾的。

聊聊对趋势的一些简单看法。

从存储介质的角度上来看,除了一篇Gain Cell和一篇STT-MRAM之外,其他五篇都是SRAM。和去年的百花齐放有所不同(去年Gain Cell,eDRAM,Flash,SRAM,RRAM都有),今年来看种类上相对来说比较单一,可能也是没有整出什么新的好活导致的。Gain Cell去年已经发过一篇,今年这篇14.2仍然是同单位,STT-MRAM去年没有作客CIM Session,今年又杀回来了。

从大的topic上来说,其实很明显可以感受到浮点CIM的问题还是有挖掘的空间,14.2,14.3,14.4,14.5四篇文章都在继续做FP CIM的主题,当然大家动机各有不同,14.2,14.3,14.4是冲着改进之前的预对齐浮点方案去的(实际上预对齐这招确实槽点很多),14.5对预对齐做了一点有限的改进,更主要的还是尝试把它和其他的场景做一下结合(比如训练)。

从类型上来看,一个模拟(14.1),一个混合域(14.6),剩下的都是数字。但这里想聊聊我的一个insight,其实数字的本质就是rail to rail的模拟,从信号的角度上来说,数字用最大的信号幅度去编码最少的信息(比特),而模拟用非轨到轨的更小信号幅度去编码更多的信息,所以从效率上来看,模拟域内的运算似乎有一定的优势,但问题在于两个点,一个是模拟域转换回数字域时的ADC开销跟模拟的信号幅度以及编码密度之间有着至少逆线性乃至逆指数关系的巨大开销,这代表着在模拟域内运算的高效优势可能会很快被抵消掉;另一个点是,模拟的编码方式实际上可以理解成是用SNR去trade效率,信号幅度越小或编码密度越高,效率自然越高,但是对应的SNR也就越差。第二点其实是我想通之后改变方法论的一个做法,用SNR去trade效率这种方法,我在数字里面也可以做,也就是用近似计算的思路用精度去换面积/能耗上的降低。同时我可以规避掉转换带来的开销问题,以及fabricate时模拟需要的一些calibrate,或者PVT上带来的问题,今年和工业界的一些人也在聊,至少在产品上去用(不管是做算力的,还是打算做边缘端SoC的),大家会异曲同工的偏好数字的方案。而近似计算本身就是一个有趣的topic,之前虽然ISSCC上有很多工作也挖掘过,但我觉得其实可以研究的问题还有很多,这是一个大的方向,我觉得值得长期往下做下去,去作为一个好的问题挖掘挖掘。

最后聊一下计算负载的问题,14.1关注了贝叶斯神经网络,14.3关注了CNN和Transformer两类负载的支持问题(这也是去年就有的一个trend)。14.5关注了edge training的问题。14.7提出了一个direction searching的负载,打破了长期以来CIM一直关注神经网络类型负载的状态。

总体上来看,感觉今年的CIM Session没有像去年那种很多新topic涌现的感觉,更多是对之前有的topic(hybrid CIM,FP CIM,CNN + Transformer)这些问题的进一步讨论。但FP CIM的范式通过三篇异曲同工的工作对预对齐方案做了一波拨乱反正还是挺有意思的,可以等论文正式放出来后看看具体的做法。14.7提出了非神经网络的负载,可能也意味着大家对于CIM的定义进一步放宽了,也许后面会有更多非网络的domain specific的任务通过CIM的方式做出来。

最后提提感想,今年拿下第二篇,更多的感觉是幸运,优秀的工作很多,能够杀出重围确实不容易。今年的工作从构思,工程实现到论文整体上比去年丝滑了很多,也是吃了一波经验增长的红利。希望后续还能再出一些更好的工作。

ISSCC2025 Computing-In-Memory Session 趋势整理的更多相关文章

  1. Session重点整理

    首先明确几个概念 (1)JSessionID:通过tomcat运行的Java项目,为新用户生成的随机字符串.(应该是tomcat设置的,我没试过别的服务器,如有错误请指正) (2)Session请求( ...

  2. Introduction to Parallel Computing

    Copied From:https://computing.llnl.gov/tutorials/parallel_comp/ Author: Blaise Barney, Lawrence Live ...

  3. 【转载】Redis 4.0 自动内存碎片整理(Active Defrag)源码分析

    click原文链接原文链接:https://blog.csdn.net/zouhuajianclever/article/details/90669409阅读本文前建议先阅读此篇博客: Redis源码 ...

  4. sqlalchemy之create_engine和session

    sqlalchemy之create_engine和session orm 实质上,一个O/R Mapping会为你生成DAL.(即为数据访问层(Data Access Layer).其功能主要是负责数 ...

  5. Elasticsearch基础知识要点QA

    前言:本文为学习整理实践他人成果的记录型博客.在此统一感谢各原作者,如果你对基础知识不甚了解,可以通过查看Elasticsearch权威指南中文版, 此处注意你的elasticsearch版本,版本不 ...

  6. client-server model peer-to-peer architecture 主从式架构

    w https://zh.wikipedia.org/wiki/主从式架构 主从式架构 (Client–server model) 或客户端-服务器(Client/Server)结构简称C/S结构,是 ...

  7. ElasticSearch详解与优化设计

    简介 概念 安装部署 ES安装 数据索引 索引优化 内存优化 1简介 ElasticSearch(简称ES)是一个分布式.Restful的搜索及分析服务器,设计用于分布式计算:能够达到实时搜索,稳定, ...

  8. iOS 视图控制器转场详解

    iOS 视图控制器转场详解 前言的前言 唐巧前辈在微信公众号「iOSDevTips」以及其博客上推送了我的文章后,我的 Github 各项指标有了大幅度的增长,多谢唐巧前辈的推荐.有些人问我相关的问题 ...

  9. hibernate导入大量数据时,为了避免内存中产生大量对象,在编码时注意什么,如何去除?

    Session session = sessionFactory.openSession(); Transaction tx = session.beginTransaction(); for ( i ...

  10. Deep Learning and the Triumph of Empiricism

    Deep Learning and the Triumph of Empiricism By Zachary Chase Lipton, July 2015 Deep learning is now ...

随机推荐

  1. centos7导入很大的数据库脚本

    前提因为远程桌面,图形化界面实在是太慢了 所以将压缩数据库文件传入到服务器某个目录下aggs_court.sql.gz解压gunzip aggs_court.sql.gz进入数据库:mysql -p@ ...

  2. Prim 算法求最小生成树

    数据参考 百度经验 博客园 楠楠IT 测试接口 牛客 连通工程 问题背景 求国家建设公路的最小开销 算法思想 首先建立 邻接矩阵 然后 设定最小消耗顶点(就是两个定点之间的权重最小)顶点集合 U 每次 ...

  3. WSL 安装 桌面系统

    简介 参考链接 https://www.cnblogs.com/it-tsz/p/11079018.html 文件传递 linux 和 windows 里面的文件传递 打开linux子系统,(注:通过 ...

  4. 星闪(Bear Pi-H2821)开发板带宽、功耗测试

    一.开发环境 硬件:H2821星闪开发板*2(BS21,BLE.SLE二合一),TypeC数据线*2 性能参数: 支持 BLE4.0/4.1/4.2/5.0/5.1/5.2/5.3/5.4 和 SLE ...

  5. SQL Server 2008通过LinkServer连接MySQL -九五小庞

    链接过程就不过多描述了,搜索下都有一大堆的内容. 链接成功以后,如何调用的问题,通过"编写select脚本"的方式生成的脚本如下: [备注:asset_manager是数据库名,a ...

  6. 如何在FastAPI中玩转Schema版本管理和灰度发布?

    扫描二维码关注或者微信搜一搜:编程智域 前端至全栈交流与成长 发现1000+提升效率与开发的AI工具和实用程序:https://tools.cmdragon.cn/ Schema版本管理实战 基础概念 ...

  7. 使用 Kiro AI IDE 3小时实现全栈应用Admin系统

    之前我是采用Node生态开发的大模型以及MCP Server,大模型开发的生态主要是Python语言,为了更好的学习大模型开发,于是开了新坑.开始学习Python, 以及 fastapi ,LangC ...

  8. c# ACME client (补充)

    上一篇 c# ACME client 漏了一部分内容,今天补上 除了之前介绍的在 asp.net core 使用方式,还可以单独在代码中使用client 简化用法 如果已经集成好完全的自动证书申请验证 ...

  9. word从excel中获取数据

    '如 word开发工具不显示,文件 选项 自定义功能区 开发工具对钩选中 'Dim 字典 Dim SubArray(2, 200) As String Dim Row As Integer Dim I ...

  10. area.js

    var areaData=[[[{"label":"东城区","value":"110101"},{"labe ...