这是 PCIe、USB、SATA、Ethernet 等的世界。
CPU 访问外设(SSD、GPU、网卡)时,通过 DMA(直接内存访问)或读写寄存器。
数据必须经过驱动层 / 操作系统,而不是 CPU 直接去 load/store。
对 CPU 来说,外设上的内容是 “设备地址空间(Device Space)”,不是 “内存地址空间”。
👉 IO语义的核心特征:
操作是消息式(message-based)或命令式(command-based),例如“DMA read / write”、“queue doorbell”。
访问延迟通常在 微秒(µs)级别。
CPU 看不到设备的内存结构,数据要经过 copy、cache flush 等过程。
在这种模式下:
CPU 或其他处理器可以直接用 Load / Store 指令访问远端设备或内存的地址空间,就像访问本地 DRAM 一样。
也就是说,互连协议不仅仅传输“块数据”,而是传输带有 内存语义(load、store、atomic、cache coherence) 的操作。
你可以这么理解:
| 类比 | IO语义互连 | 内存语义互连 |
|---|---|---|
| 像什么 | USB 移动硬盘 | 把别人的内存条插在自己主板上 |
| 访问方式 | 通过文件系统 / 驱动访问 | 直接读写内存地址 |
| 延迟 | 微秒级 | 纳秒级 |
| 典型协议 | PCIe, Ethernet, NVMe | CXL.mem, Gen-Z, CCIX.mem, NVLink |
| 适用对象 | 外设通信 | CPU ↔ GPU ↔ 内存 ↔ 加速器的共享内存体系 |
一句话解释:
内存语义互连让 “远端内存” 看起来就像 “本地内存” 一样,可以被 load/store、可以 cache、甚至可以原子操作。
要实现“内存语义”,互连总线必须具备:
缓存一致性(Cache Coherency)
保证 CPU、GPU、加速器共享同一份内存数据时不会互相冲突。
例如:CXL.cache, CCIX.cache。
低延迟的传输层
延迟必须足够低(几十纳秒),否则无法支持频繁的 load/store 操作。
统一地址空间
设备内存被映射到 CPU 的物理地址空间中。
CPU 可以直接用普通的 MOV, LOAD, STORE 指令访问。
原子性支持
协议支持 atomic add, compare-and-swap 等操作(这在多处理器共享内存环境下非常重要)。
| 协议 | 是否基于PCIe物理层 | 是否具备内存语义 | 典型应用 |
|---|---|---|---|
| PCIe | ✅ | ❌(纯IO语义) | SSD, NIC, GPU |
| CXL 1.1 / 2.0 / 3.0 | ✅ | ✅(CXL.mem / cache) | CPU–Memory Expander / GPU 共享内存 |
| Gen-Z | 可基于 PCIe / Ethernet PHY | ✅ | Memory Pool / Fabric Memory |
| CCIX | ✅ | ✅ | CPU–Accelerator Coherent Fabric |
| NVLink (NVIDIA) | ❌(专用物理层) | ✅ | GPU–GPU / GPU–CPU 共享显存 |
| AMD Infinity Fabric | ❌ | ✅ | CPU–GPU–Memory 统一互连 |
突破“内存墙”
CPU 性能增长远快于内存带宽增长。
内存语义互连让多个节点共享内存池(Memory Pooling),提升内存利用率。
实现“分解式架构(Disaggregated Architecture)”
把 CPU、GPU、Memory、Storage 分开,按需组合成一个逻辑系统。
服务器不再是“板上固定资源”,而是“资源池+互连网络”。
数据中心级共享内存
不同服务器节点之间可直接通过内存语义互连访问对方的内存,实现集群级共享内存架构。
想象你的电脑主板上插满了各种 DDR5 DIMM, 现在 CXL / Gen-Z 就相当于让 整排机架里的所有内存条都能通过超低延迟通道挂在你的内存控制器下。
CPU 发出的 LOAD RAX, [ADDR] 指令,不再只命中本地 DRAM,而可能通过互连协议在 100 ns 内去访问机架另一端的内存模块。
这就是 “Memory Semantic Interconnect” 的力量。
内存语义互连(Memory Semantic Interconnect) 是一种允许不同计算单元(CPU、GPU、FPGA、加速器)在“共享统一的内存地址空间”中直接进行 load / store / atomic 操作的互连方式。
它让“远端内存”像“本地内存”一样可用,从微秒级 I/O 通信,进化为纳秒级共享内存访问。
🔧 代表标准:Gen-Z、CXL、CCIX、NVLink、Infinity Fabric。
https://pan.baidu.com/s/18_c11aeFhSBe2qa-jUFs_Q?pwd=mm9y 提取码: mm9y
如果你有其任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的我问题想咨询,请访问:访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品;或者添加点击左下角“阅读原文”留言,或者saniffer公众号留言,致电021-50807071 / 13127856862,sales@saniffer.com。