很多人都知道,计算机里有负责计算的“大脑”(CPU/GPU),也有负责记忆的“仓库”(内存和硬盘)。但在过去的几十年里,这个架构一直有个巨大的痛点:“仓库”和“大脑”离得太远了。 每次计算,数据都要在两者之间来回搬运,不仅耗时,而且90%的功耗都浪费在了“跑腿”的路上。这就是行业内著名的“冯·诺依曼架构瓶颈”(也叫存储墙)。
为了打破这堵墙,过去10到20年里,科学界和产业界把目光投向了新型非易失性存储技术(Next-Generation NVM)。其中最耀眼的明星之一,就是阻变存储器(RRAM,或者叫ReRAM)。
今天,我们就用大白话,把RRAM从实验室里的“一个微小的细胞(Cell,存储单元)”,到改变AI算力的“存算一体(CIM)芯片”的演进全生命周期彻底拆解。看完你会发现,从事RRAM研发的人,每天究竟在和什么恶魔与天使打交道。
RRAM的底层逻辑其实非常朴素:用电阻的高低来代表数据的 0 和 1。
我们可以把一个RRAM Cell(存储单元)想象成一段“可以人工制造闪电”的微型管道。
最神奇的是,断电之后,这条导电丝依然保持原样。 也就是说,它既有不输给DRAM的读写速度,又像U盘一样断电不丢数据。
在Cell阶段,科学家和材料工程师主要在“玩泥巴”(调配材料)。他们要解决的是物理与化学的微观极限:
当你成功驯服了一个Cell,接下来就要把成千上万个Cell连成一片,组成“存储阵列”(Array)。在这个阶段,行业里演进出了两种主流的阵列结构:Mini-Array 和 Cross-bar Array。
很多人容易混淆这两者,我们用一个直观的例子来区分:
Cross-bar非常像城市的十字天桥。纵向是走线(BitLine),横向也是走线(WordLine),在每个十字路口交叉点,直接夹住一个RRAM Cell(这就是 0T1R 结构,0个晶体管,1个电阻)。
为了规避Cross-bar那种复杂的漏电问题,工业界更常用的是Mini-Array。它通常采用 1T1R(一个晶体管管一个电阻) 的结构。
这两年,你一定被CIM(Compute in Memory,存算一体)或IMC(In-Memory Computing)这两个词刷屏了。
澄清一个业内误区: 有人问,CIM之所以火,是因为RRAM阵列能实现“快速的训练和推理”吗?
准确地说:它极度擅长“推理”(Inference),但目前并不适合“大规模训练”(Training)。
这就是真正的“存算一体”! 数据不需要搬运,电流流过阵列的一瞬间,乘法和加法同时完成了。速度极快,功耗降低了几个数量级,简直是边缘端AI推理(如智能穿戴、机器人、车载芯片)的神器。
因为AI训练需要频繁、反复地改写权重值(反向传播)。而RRAM的“写寿命”和“写功耗”面对动辄千亿次擦写的训练任务时,有些吃不消;且RRAM的电阻调节很难做到绝对线性和对称。所以,目前CIM RRAM的主战场是高能效的AI推理。
很多搞学术的同学止步于CIM Array,但要真正变成一颗芯片,必须走到 IP Macro(知识产权宏模块) 阶段。
你可以把整个芯片设计想象成“在电脑里装配一套精装房”。
到了IP Macro阶段,研发的重心从“材料和物理”彻底变成了“工程落地与量产验证”:
从一个Cell到一整个IP Macro,新型存储技术的研发是一场跨越材料学、微电子学、计算机架构和集成电路设计设计(EDA)的接力赛:
非易失性存储与存算一体的黄金时代才刚刚开始。希望这篇长文,能帮揭开RRAM神秘面纱的你,找到下一个努力的方向。对于RRAM各个阶段测试感兴趣的朋友,可以添加saniffer公众号查询关键词:TestMesh,或者NplusT,或者新型存储,等。
欢迎在评论区留下你对存算一体(CIM)前景的看法,点赞、在看、转发,支持硬核国产芯片技术科普!
更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND,新型存储技术NVM(RRAM/ReRAM, FRAM/FeRAM, MRAM, PCM, 3D-NOR, SRAM/DRAM等) DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。
欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。