本视频展示了一套基于光纤传输的高性能 PCIe/CXL 远端设备延伸方案。该系统旨在将 GPU、DPU、网卡及 CXL 内存扩展模块等高带宽设备从主机近端“物理拉远”,实现 10 米、20 米、乃至 50 米距离的高速互联。
此次演示的核心亮点在于对上电流程进行了深度优化——通过硬件与固件协同改进,实现了 “一键开机,自动挂载” 的功能,使设备能够在首次上电后直接完成链路建立与识别。
CXL 内存池化借助该光纤传输方案,主机能够在远端挂载多个 CXL 内存扩展模块,构建出规模化的大容量内存池(演示中提及可扩展至百 GB 乃至 TB 级别),为大模型训练、AI 推理及高性能计算提供灵活的共享内存资源。
系统散热与空间优化高功耗设备(如 GPU、DPU)可集中部署于独立散热区域,远离主机主板,从而显著优化机架内的气流分布与散热效率。
测试与维护灵活性研发与验证人员可以在远端灵活更换不同类型的测试卡、协议卡或计算卡,而无需频繁拆装主机,大幅提升调试与实验效率。
服务器或工作站,支持 PCIe 5.0 / CXL 2.0。
安装一张近端光电转换卡,负责信号重定时与光电转换。
使用双模光模块与光纤连接近端与远端。
演示示例为 10 米光纤,已验证 20 米与 50 米链路均可稳定运行。
远端光电转换卡,提供标准 PCIe 金手指插槽,用于插接目标设备。
独立供电模块(ATX 4-pin 或 CRPS 电源)为远端设备提供电力。
演示实例使用 摩尔线程(MooreThread)GPU S80。
该位置也可替换为 PCIe switch 卡或 CXL 内存模块等。
系统使用标准化的 lane 对接方式:
每根光纤传输 8 条 lane;若需全带宽 x16,则需同时连接两组光纤(lane 0–7 与 8–15)。
接线需严格遵循“靠近设备的一端对接靠近金手指的一组 lane”的原则,以确保信号方向正确。
光缆长度可灵活替换,无需改变连接拓扑。
这种模块化设计使得带宽配置可按需调整,既可用于 x8 测试环境,也能满足全带宽 x16 的高负载场景。
远端设备的供电完全独立于主机系统,采用外置 ATX 或 CRPS 模块(参见本文底部的简介)。
供电通过专用小板分配至远端金手指插槽。
光纤仅传输高速信号,不承担电力输送职能。
推荐在上电前检查供电模块输出稳定性与接地状况,以避免启动异常。
一键上电:所有物理连接完成后,直接按下服务器电源键,系统自动识别远端设备并完成建链,无需手动 reset。
系统识别:启动完成后,可通过 lspci 命令确认设备是否成功挂载。演示中搜索关键字 “Moore” 后可见设备 BDF 为 0b:00.1。
性能验证:使用 lspci -vvv 查看 Link Capabilities 与 Link Status。演示结果显示:
设备支持: PCIe Gen5 x16
实际链路: 成功建立 Gen5 x16这说明远端设备在物理延伸数十米后仍可保持满速传输。
已通过 10m、20m、50m 光纤长度验证,建链稳定、性能符合 Gen5 预期。
对于 CXL 内存池化场景,仍需结合操作系统与驱动层面的配套支持,才能实现生产级使用。
确保供电先行且稳定,尤其在使用 CRPS 模块时注意防止瞬时电压波动。
严格遵守 lane 对位规则,避免因对接方向错误导致链路建立失败。
每次部署后执行带宽验证,确认实际链路速率与宽度(Gen5 x16)。
长距离光纤需提前测试 BER 与延迟抖动,防止在大规模并行通信中出现隐性错误。
加强远端散热设计,若部署多张 GPU/DPU,应保证足够风道与环境温控。
本演示成功验证了基于光纤的 PCIe/CXL 远端设备延伸方案的可行性,实现了 远距高速、全带宽、自动挂载 的系统能力。
其创新点主要包括:
对传统复杂上电流程的简化;
对高带宽信号完整性的保持;
以及在物理布局与散热管理上的灵活性提升。
未来,该方案可广泛应用于:
AI 计算中心的 GPU 远程部署;
CXL 内存池化系统;
以及大规模分布式训练与测试场景。
若进一步结合智能电源控制、动态链路监控与集中式管理软件,该技术有望成为下一代 分布式算力节点互联的基础形态。
Common Redundant Power Supply(通用冗余电源) 它是一种为服务器和数据中心机柜设计的 标准化可热插拔电源模块 规范。
Common(通用)
接口、尺寸、信号定义遵循统一标准(如 Intel 制定的 CRPS 2.0/3.0 规范),不同厂商可互换。
Redundant(冗余)
支持 N+1 或 N+N 冗余配置;即使一块电源故障,系统仍能继续运行。
Power Supply(电源模块)
输出通常为 12V 主电源,部分型号还提供 5VSB(待机电源)。
支持 PMBus 通信,可监控电压、电流、温度、风扇转速等状态。
机架式服务器(1U/2U/4U)
GPU 或存储机箱
网络交换设备
高性能计算节点的远端供电模块(如你视频演示中远端供电板使用的那种)
| 版本 | 尺寸(宽 × 高 × 深,mm) | 功率范围 | 发布机构 | 特点 |
|---|---|---|---|---|
| CRPS 2.0 | 73.5 × 40 × 185 | 550W–2400W | Intel | 行业主流标准,广泛兼容 |
| CRPS 3.0 | 同上 | 2400W–3200W | Intel | 更高功率密度,支持 48V 输入版本 |
CRPS = Common Redundant Power Supply 是一种 标准化、可热插拔、支持冗余的服务器电源模块规范,用于高可靠性机架系统与分布式算力设备。
https://pan.baidu.com/s/18_c11aeFhSBe2qa-jUFs_Q?pwd=mm9y 提取码: mm9y
如果你有其任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的我问题想咨询,请访问:访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品;或者添加点击左下角“阅读原文”留言,或者saniffer公众号留言,致电021-50807071 / 13127856862,sales@saniffer.com。