【每日一题】从一个“会记仇”的电阻,到颠覆AI算力的芯片IP:非易失性存储(NVM)的二十年突围
2026-06-09 15:23:37

很多人都知道,计算机里有负责计算的“大脑”(CPU/GPU),也有负责记忆的“仓库”(内存和硬盘)。但在过去的几十年里,这个架构一直有个巨大的痛点:“仓库”和“大脑”离得太远了。 每次计算,数据都要在两者之间来回搬运,不仅耗时,而且90%的功耗都浪费在了“跑腿”的路上。这就是行业内著名的“冯·诺依曼架构瓶颈”(也叫存储墙)。

为了打破这堵墙,过去10到20年里,科学界和产业界把目光投向了新型非易失性存储技术(Next-Generation NVM)。其中最耀眼的明星之一,就是阻变存储器(RRAM,或者叫ReRAM)

今天,我们就用大白话,把RRAM从实验室里的“一个微小的细胞(Cell,存储单元)”,到改变AI算力的“存算一体(CIM)芯片”的演进全生命周期彻底拆解。看完你会发现,从事RRAM研发的人,每天究竟在和什么恶魔与天使打交道。

一、 起点:Cell阶段 —— 驯服一个“会记仇”的电阻

RRAM的底层逻辑其实非常朴素:用电阻的高低来代表数据的 0 和 1。

我们可以把一个RRAM Cell(存储单元)想象成一段“可以人工制造闪电”的微型管道。

  • 写“1”: 我们给它加一个正向电压,管道里就会生长出一条由金属原子或氧空位构成的“纳米导电丝”(就像一道固定的闪电)。管道通了,电阻变低(LRS,低阻态)。
  • 擦“0”: 我们反向加一个电压,把这条导电丝炸断。管道又堵上了,电阻变高(HRS,高阻态)。

最神奇的是,断电之后,这条导电丝依然保持原样。 也就是说,它既有不输给DRAM的读写速度,又像U盘一样断电不丢数据。

工程师在这个阶段研究什么?

在Cell阶段,科学家和材料工程师主要在“玩泥巴”(调配材料)。他们要解决的是物理与化学的微观极限

  1. 找材料: 夹层用氧化铪、氧化钛还是氧化钽?电极用铂、钛还是氮化钛?
  2. 死磕寿命(Endurance)与保持力(Retention): 这条导电丝反复擦写10万次、100万次后,会不会彻底断掉或者连死?在125℃的高温下,它能保证10年不化吗?
  3. 一致性(Variability): 每一个Cell由于原子随机运动,长出来的导电丝粗细都不同。如何让同一个晶圆上的几十亿个Cell,电阻值都听话?

二、 进阶:阵列阶段(Array) —— 从“独木成林”到“十字路口”

当你成功驯服了一个Cell,接下来就要把成千上万个Cell连成一片,组成“存储阵列”(Array)。在这个阶段,行业里演进出了两种主流的阵列结构:Mini-Array 和 Cross-bar Array

很多人容易混淆这两者,我们用一个直观的例子来区分:

1. Cross-bar Array(交叉阵列):极致的拥挤与“漏电”的烦恼

Cross-bar非常像城市的十字天桥。纵向是走线(BitLine),横向也是走线(WordLine),在每个十字路口交叉点,直接夹住一个RRAM Cell(这就是 0T1R 结构,0个晶体管,1个电阻)。

  • 优点: 密度极高!因为不需要体积巨大的晶体管,Cell可以做到理论上的最小尺寸。
  • 致命缺点——走电与串扰(Sneak Path): 当你想读某一个十字路口的数据时,电流会顺着旁边其他交叉点偷偷溜过去(因为大家都是连通的)。这就导致读出来的数据全是“噪音”。为了解决这个问题,工程师必须在每个路口再加一个微型的“单向阀门”(Selector,选择器)。

2. Mini-Array(小微阵列):正规军的模块化作战

为了规避Cross-bar那种复杂的漏电问题,工业界更常用的是Mini-Array。它通常采用 1T1R(一个晶体管管一个电阻) 的结构。

  • 晶体管就像一个严格的看门大爷。只有大爷开门(给栅极电压),电流才能通过这个RRAM Cell。
  • 它的漏电问题被彻底解决了,但代价是体积变大(因为晶体管很占地方)。为了兼顾效率,工程师会把成百上千个这样的1T1R单元打包成一个“Mini-Array”,作为基本模块。

工程师在这个阶段研究什么?

  1. 阵列效率: 怎么在有限的面积里塞进更多Cell,同时保证走线延迟(IR Drop)不会让末端的Cell收不到信号?
  2. 选择器(Selector)研发: 在Cross-bar中,寻找一种能完美开关、耐高压的Selector材料,是制造成败的关键。

三、 爆发:CIM/IMC 阵列 —— 为什么它成了AI时代的香饽饽?

这两年,你一定被CIM(Compute in Memory,存算一体)IMC(In-Memory Computing)这两个词刷屏了。

澄清一个业内误区: 有人问,CIM之所以火,是因为RRAM阵列能实现“快速的训练和推理”吗?

准确地说:它极度擅长“推理”(Inference),但目前并不适合“大规模训练”(Training)。

这就是真正的“存算一体”! 数据不需要搬运,电流流过阵列的一瞬间,乘法和加法同时完成了。速度极快,功耗降低了几个数量级,简直是边缘端AI推理(如智能穿戴、机器人、车载芯片)的神器。

为什么不适合做训练?

因为AI训练需要频繁、反复地改写权重值(反向传播)。而RRAM的“写寿命”和“写功耗”面对动辄千亿次擦写的训练任务时,有些吃不消;且RRAM的电阻调节很难做到绝对线性和对称。所以,目前CIM RRAM的主战场是高能效的AI推理

工程师在这个阶段研究什么?

  1. 模拟信号的精度: 电流是模拟信号,外界温度一变,电流就飘了。怎么在高噪声下保证AI的识别准确率?
  2. 外围电路设计(ADC/DAC): 输入的数字信号要转成电压(DAC),输出的电流要转回数字信号(ADC)。这两个转换器往往占了CIM阵列80%的功耗,怎么优化它们是核心难题。

四、 落地:IP Macro阶段 —— 从“裸阵列”到“即插即用的商品”

很多搞学术的同学止步于CIM Array,但要真正变成一颗芯片,必须走到 IP Macro(知识产权宏模块) 阶段。

什么是IP Macro?(通俗大白话解释)

你可以把整个芯片设计想象成“在电脑里装配一套精装房”。

  • 芯片设计公司(比如苹果、华为海思、高通)不是每个电线杆、每个马桶都自己从零发明。他们会去买成熟的“全套卫浴”或“整体厨房”设计图纸,直接拖进自己的设计软件里。
  • 这个“整体厨房的设计图纸”,在半导体行业就叫做 IP Macro
  • 一个RRAM IP Macro,不仅包含了中间那个能存能算的RRAM阵列(灶台),还帮你把外围的电源管理、时钟控制、读写放大器、数字接口(柜子、管道、油烟机)全部画好了。买过去,直接接到芯片的总线上就能用。

工程师在这个阶段研究什么?

到了IP Macro阶段,研发的重心从“材料和物理”彻底变成了“工程落地与量产验证”:

  1. DFT(可测性设计): 芯片做出来有几十亿个点,怎么设计一条快速“自检”电路,在1秒钟内找出哪个Cell是坏的?
  2. 设计规则(Design Rules)与良率: 配合台积电、中芯国际等晶圆厂(Foundry)的工艺节点(比如22nm/28nm),调整电路版图(Layout),确保量产时的良率能达到90%以上。
  3. 各种Corner(工艺角)验证: 在绝对极寒(-40℃)和绝对狂热(125℃)、电压不稳的各种极端恶劣环境下,这个Macro能不能稳定工作不崩盘?

总结:RRAM研发的大图景

从一个Cell到一整个IP Macro,新型存储技术的研发是一场跨越材料学、微电子学、计算机架构和集成电路设计设计(EDA)的接力赛

  • 如果你喜欢材料和物理: Cell阶段和Selector研发是你的天堂,你在微观尺度上驯服原子。
  • 如果你擅长电路和算法: CIM阵列和外围电路(ADC/DAC)设计需要你大显身手,你在用硬件实现数学之美。
  • 如果你崇尚工程落地: IP Macro的版图设计、可靠性验证和晶圆厂对接,是决定技术能否改变世界的关键一步。

非易失性存储与存算一体的黄金时代才刚刚开始。希望这篇长文,能帮揭开RRAM神秘面纱的你,找到下一个努力的方向。对于RRAM各个阶段测试感兴趣的朋友,可以添加saniffer公众号查询关键词:TestMesh,或者NplusT,或者新型存储,等。

欢迎在评论区留下你对存算一体(CIM)前景的看法,点赞、在看、转发,支持硬核国产芯片技术科普!

更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND,新型存储技术NVM(RRAM/ReRAM, FRAM/FeRAM, MRAM, PCM, 3D-NOR, SRAM/DRAM等) DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。

欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。