本周前三天的2025 OCP全球峰会到底看到了什么?
2025-10-17 10:39:51

截至今天,OCP Summit 2024总计4天的会议已经过去了3天,我们结合业内关于该本次峰会的各种新闻报道和现场解读给大家一个关于本次OCP峰会的各种热点的综合分析和导读,帮助因为各种原因无法到现场的用户了解该峰会,特别要介绍一下在现场设立展台的比较热门的公司的产品和技术。

2025 OCP峰会综述:开放计算热点技术与动态

中国厂商精彩亮相

本次在美国圣何塞(San Jose)举行的2025 OCP全球峰会上,我们上周五的文章《下周的2025 OCP全球峰会到底看什么?》提到有一些中国大陆企业参与,展示各自的开放计算成果和产品。光通信领域,中国厂商如Accelink光迅科技Linktel联特等也出现在展区,展示了最新高速光模块和光互连方案,包括面向1.6Tb/s级别带宽的光模块产品和有源/无源线缆解决方案。在开放硬件配件方面,来自大陆的连接器与线缆供应商立讯精密(Luxshare)也作为OCP赞助商参展,为高速PCIe与网络互连提供解决方案。同样值得关注的是国内存储企业对OCP规范的支持:例如大普微电子(DapuStor)等企业级SSD厂商参与OCP社区,推动符合OCP NVMe Cloud SSD规范的产品研发和测试,以满足超大规模数据中心对开放存储的需求。可以说,中国厂商在本届峰会上从互连芯片、光模块到存储设备均有亮相,体现了中国力量在开放计算生态中的积极贡献和技术实力。

另外,在现场我们也看到下一代互连技术创业公司XConn科技联合MemVerge公司现场演示了基于CXL的内存池方案:通过XConn自主研发的Apollo交换芯片(业内首个混合CXL/PCIe交换机)搭配MemVerge的Memory Machine X软件,实现了大规模动态内存池在AI工作负载中的应用,针对KV缓存等场景比传统SSD方案性能提升超过5倍。

PCIe、CXL与液冷等基础设施热点

在底层硬件基础设施方面,本届OCP峰会围绕高速互连与高效散热展开了诸多讨论和展示。PCIe 5.0/6.0与CXL互连是关注焦点之一:大会强调通过CXL实现内存池化和共享已成为突破“内存墙”的关键手段。例如Compal等厂商展示了基于CXL Fabric的内存扩展与资源池化技术,以及结合RDMA的动态资源调度方案,使服务器节点间能够实现多TB级别的低延迟内存池。这些架构通过PCIe Gen5、CXL 3.0/3.1等高速总线在服务器之间构建高带宽数据交换,让存储即内存(Storage-as-Memory)的理念成为可能。同时,新型PCIe交换芯片和Retimer时钟重定时器也备受瞩目——专注互连方案的Astera Labs在其B33展位展示了面向机架级AI系统的PCIe 6.0模块化背板技术和真实PCIe 6.0规模扩展方案,以及自研的UA-Link开放互连规范。这些方案通过主动式背板、智能线缆等方式来突破传统被动背板的长度和带宽限制,满足AI训练集群内部超大规模“Scale-Up”互连需求。值得一提的是,Astera Labs等公司还参与了OCP的新互连工作组,推动PCIe Gen7乃至更新代际标准的预研,以及通过开放联盟(如UA-Link、CXL、以太网ESUN等)制定统一规范,解决不同厂商Retimer/交换芯片之间的互通性问题。

PCIe over Optics方面,随着带宽步入224G PAM4每通道时代,光电融合互连成为热点议题。OCP赞助商鸿腾FIT(富士康旗下)在现场通过动态和静态展示相结合的方式,发布了224G时代的一系列技术突破,包括共封装光学连接器(CPO/CPC)、224Gbps高速互连以及51.2Tb交换机散热技术。FIT首次动态演示了224G OSFP光模块冷板直液冷方案,即使在极限热负载下仍能让服务器保持稳定运行,大幅提高散热效率和机柜部署密度。同时发布的还有强化信号完整性和EMI防护的“高架式”OSFP连接器/笼型系统,以确保新一代光模块在超高速环境下稳定工作。针对更高带宽的短距连接,FIT还推出了完整的1.6Tb/s有源/无源铜缆系列,以在性能、功耗和成本间取得平衡。这些高速线缆和光互连产品将为未来PCIe/CXL总线通过光介质延伸提供可能,使机柜乃至跨机柜的互连突破传统铜缆距离限制。协同设计的以太网也是大会讨论的重点之一。OCP宣布成立“以太网Scale-Up网络联盟(ESUN)”,推进以太网作为统一物理层同时支持多种传输协议,用开放的以太生态来承担原先专有高速互连的角色。博通公司在大会第二日的主题演讲中亦强调了以太网在AI集群Scale-Up中的可行性,并现场发布了代号“Thor Ultra”的业界首款800GbAI**以太网NIC,支持4×200G或8×100G配置,强化了RDMA通信的乱序数据放置、选择性重试等特性,旨在满足数万GPU集群内超低延迟互联的需求。博通表示该NIC可兼容任何品牌交换机、线缆和XPU设备,实现真正开放的互连生态。可见,无论是PCIe/CXL总线还是以太网络,各大厂商正共同推动开放互连**技术的发展,通过光电融合和协议抽象,实现不同架构之间的高效解耦与互通。

在数据中心散热与液冷领域,本届峰会同样亮点频出。随着AI训练集群功耗激增,传统风冷遇到瓶颈,液冷技术成为OCP关注的焦点之一。谷歌最近开放的2MW级液冷分配单元(CDU)设计“Project Deschutes”由散热厂商Boyd带到了现场。这套第五代CDU提供高达2兆瓦的冷却能力,将冷板进出温差压缩到仅3°C,同时提供最高80 PSI的强大冷却液压力,能够满足未来GPU/CPU超高热设计功耗的冷却需求。该CDU配备冗余泵回路电源和0.2微米精度的旁路过滤系统,可将冷却液中的微粒杂质过滤干净,延长冷液使用寿命并降低维护频次。这正是针对液冷部署中冷却液污染沉积等痛点所做的改进,可有效缓解冷液因杂质沉淀或劣化导致传热效率下降的问题hpcwire.com。在大会的“两相冷却和浸没式冷却”分论坛上,专家们还讨论了高流速下管路腐蚀侵蚀、冷 plates变形等工程挑战的应对之道。为此,新型材料的冷板、改进的阀门和快速接头设计也在展区亮相。例如FIT公司展示了专为液冷系统设计的高速快拆接头(如FD83系列),采用浮动式结构,方便插拔同时保证密封和信号完整性。另外,OCP组织还发布了液冷部署TCO模型冷却系统遥测标准提案,帮助数据中心运营者评估液冷带来的成本与减碳效益。总的来看,从冷板直冷、浸没冷却到CDU总供,以及冷液监测与维护,各环节技术在OCP峰会上都有了最新进展:大型AI算力机柜开始采用双路市电冗余供电的液冷架构,并借助开放标准在不同厂商液冷方案之间实现兼容,这将加速液冷在全球高密度数据中心的部署落地。

人工智能算力与 NVIDIA 动态

“引领AI未来”是今年OCP峰会的主题。大会期间的诸多发布和讨论都围绕着如何构建更开放、更强大的AI基础设施展开。作为AI硬件领域的领导者,NVIDIA在本届峰会上也格外引人注目。NVIDIA加速计算部门副总裁Ian Buck在首日发表题为“塑造AI开放基础设施未来”的主题演讲digitimes.com。他指出当今已步入“Giga-Scale”级别的AI算力时代,NVIDIA的关注点已从GPU本身扩展到完整数据中心系统,涵盖机架、互连、冷却和电源各方面。Buck将未来的数据中心比作“AI工厂”,需要像生产流水线一样进行协同设计与优化,并强调开放合作是实现这一愿景的关键。NVIDIA在大会上分享了其最新AI基础设施路线图:代号“Vera Rubin”的新架构计划于2026年推出,引入CPU侧的CPX协处理器与下一代GPU协同,可实现高达8倍的推理吞吐提升,并支持400G级别以太网互连;配套的OCP标准机架(MGX框架)将提供液冷散热、500A大电流母线和模块化电源等增强,使整 rack 能承载更高功率AI计算。展望2027年,NVIDIA预告了代号“Kyber”的架构,可将每机架GPU数量扩大到576颗,并引入800V高压直流供电来进一步提升能效。这些前瞻设计都显示NVIDIA正积极参与OCP社区,在开放标准的机柜和电力架构上贡献自己的经验。

在网络方面,NVIDIA发布了一系列基于Spectrum-X以太网架构的新进展。值得关注的是,NVIDIA宣布将部分网络产品和规范贡献给OCP社区:例如推出一款OCP开放交换机Minipack 3N,搭载NVIDIA最新Spectrum芯片并运行FBOSS开放交换机操作系统,为AI集群提供近95%有效带宽的以太网网络。同时NVIDIA发布了Spectrum-XGX跨数据中心互连方案,利用光纤以太网将地理上分散的AI集群连接起来,支持“Scale-Across”的分布式训练架构。这些举措表明NVIDIA正从单机柜走向多园区级AI网络布局。大会还透露,Meta等超级规模数据中心运营商已开始采用NVIDIA的Spectrum-X以太网方案来搭建开放AI网络:例如Meta和Oracle计划在其AI数据中心部署NVIDIA的Spectrum-X以太网交换和软件栈,以扩展AI训练集群。这一消息引发业界关注,因为Meta作为OCP发起方,过去倾向于自研或与开放社区合作网络方案,而此次选择NVIDIA的端到端以太解决方案,意味着NVIDIA正从GPU供应商成长为AI数据中心整体方案的重要提供者。Ian Buck在演讲中也特别提到,NVIDIA正深度参与OCP各项目组(近期NVIDIA甚至加入了OCP董事会),以“开放+垂直整合”的方式帮助业界打造异构融合的AI基础设施。例如,NVIDIA宣布开放其NVLink互连协议给第三方(称为NVLink-Fusion),这将允许非NVIDIA的CPU和加速器直接接入NVLink高速互联总线。目前英特尔、富士通、Astera Labs、三星、Marvell等公司都已成为早期合作伙伴。这项举措无疑加强了不同厂商AI芯片间的互操作性,拓展了OCP开放生态下跨厂商加速器互联的可能性。除了NVIDIA之外,AMD也在大会上高调分享了各项AI开源进展:CTO Mark Papermaster强调“历史证明开放生态最终胜出”,宣布全面开源AMD的ROCm GPU软件栈,并将自家核心互连技术Infinity架构贡献给新成立的UA-Link联盟,以推动开放的GPU直连标准;同时AMD正式加入上文提到的ESUN以太网Scale-Up联盟,积极参与制定基于以太网的异构计算互连抽象层。由此可见,在AI加速硬件领域,开源协作正成为共识:无论NVIDIA还是AMD,都在通过开放硬件规范和软件生态与业界共同应对算力规模爆炸的挑战。正如NVIDIA高管所言:“OCP社区对打造开放、可扩展的AI工厂至关重要”——这也点明了本届峰会的主题宗旨。

测试、诊断与调试新工具

为了支撑上述新技术的落地,本届OCP峰会也聚焦了测试与运维领域的新进展。随着硬件系统复杂度骤增,如何有效地验证、诊断和调试成为关键话题。一系列面向PCIe 6.0、CXL 3.0等前沿接口的测试工具在会上亮相。协议分析仪厂商SerialTek的Kodiak PCIe Gen6分析仪/训练器是业界首批支持PCIe 6.0和CXL 3.x的综合分析工具

SerialTek 推出符合 OCP 标准的 PCIe 6.0 和 CXL interposer,以加速超大规模 AI/ML 性能,全新 SI-Fi™ Interposer为 64 GT/s 的 OCP NIC 和 SSD 提供协议和功率分析

SerialTek的 OCP NIC 3.0interposer将 PCIe Gen6 和 CXL 3.x 可见性直接带入 OCP 生态系统。”   — SerialTek 首席执行官 Paul Mutschler

领先的 PCI Express® (PCIe®) 和 Compute Express Link™ (CXL®) 协议测试和分析解决方案提供商 SerialTek推出了其下一代符合开放计算项目 (OCP) 标准的中介层解决方案。这款新型中介层专为 64 GT/s 的 PCIe 6.0 和 CXL 3.0 设计,可在 OCP NIC 3.0 和 EDSFF 规格中提供高保真信号捕获和高级功率分析。超大规模工程师依靠 SerialTek 的解决方案来验证下一代数据中心和 AI/ML 基础设施的性能和可靠性。

全新interposer封装与 SerialTek 的 Kodiak™ 高级协议测试和分析系统无缝集成,采用 SerialTek 专有的 SI-Fi™(信号完整性保真度)技术,该技术专为超低损耗和透明信号采集而设计,可在高速捕获中提供无与伦比的信号保真度。与 Quarch 的功率分析模块配合使用时,该系统可提供同步的协议和功率数据,这对于调试、优化和合规性测试至关重要。SerialTek 首席执行官 Paul Mutschler 表示:“我们的 OCP NIC 3.0interposer将 PCIe Gen6 和 CXL 3.x 的可视性直接带入 OCP 生态系统。它专为应对 OCP NIC 3.0 和 EDSFF 设计中独特的信号和机械挑战而设计,为工程师提供验证下一代超大规模和 AI 平台所需的保真度和外形尺寸精度。”

集成Power Analysis功耗分析

借助 Quarch Technology 的 QTL2312 功率分析模块,OCPinterposer可以捕获实时功耗以及协议流量,从而提供设备性能的多维视图,这对于必须兼顾效率和吞吐量的 AI 工作负载和超大规模部署至关重要。 Quarch 董事总经理 Andy Norrie 表示:“我们与 SerialTek 的合作为 PCIe 6.0 和 CXL 测试带来了无与伦比的功率可视性。对于 OCP 和 EDSFF 平台,功率行为与协议行为同样重要,而这种组合可以同时实现这两者。”

SerialTek PCIe协议分析仪能够以高达64GT/s速率捕获和产生PCIe 6.0/CXL 3.0协议流量(×4链路),内置灵活的主机模拟适配器,无需额外主机即可对被测设备执行标准一致性测试。该平台支持各种形式的协议探测夹具(包括CEM, EDSFF, MCIO, OCP NIC 3.0, M.2, U.2接口等),配套软件可实时解码分析高速链路层数据,并提供错误注入和脚本化测试等高级功能,帮助工程师定位PCIe/CXL链路中的复杂问题。SerialTek表示,随着PCIe 6.0时代来临,他们与业内公司紧密合作,提供这一强大的调试平台来缩短开发周期。此外,大会的Hardware Management硬件管理项目组介绍了一系列新规范,包括针对Silent Data Corruption静默数据错误的检测机制、新的开放调试(Debug)和RAS规范、自动化故障管理策略等。例如,OCP计划推出统一的芯片级调试接口标准,方便不同厂商设备的底层可及性,提高故障诊断效率;又如在开放BMC和Telemetry方面,引入可扩展遥测和诊断日志标准,便于AI集群运维人员及时发现异常。这些举措表明,在性能竞赛之外,可靠性与可维护性也日益受到开放计算社区的重视——相应的新工具和新规范将帮助工程师更快速地发现并解决系统瓶颈或错误,为大规模部署保驾护航。

上述Gen6 Interposer两端的接口为原生态OCP 3.0接口

存储及OCP一致性测试进展

在存储与接口测试方面,值得一提的是SANBlaze公司带来的最新消息。作为OCP官方指定的存储测试方案提供商,SANBlaze在峰会上重点介绍了其“Certified by SANBlaze” NVMe SSD测试套件。这一套件集成于SANBlaze自家的PCIe Gen5/6架构测试平台中,能够自动运行一系列测试来验证厂商的NVMe固态硬盘是否符合OCP开放计算规范的要求。目前套件已完整支持OCP针对数据中心NVMe SSD制定的Cloud SSD规范2.0测试项,并在持续开发新增对最新OCP 2.5/2.6/2.7规范的覆盖。通过该套件,SSD厂商可以一键执行包括灵活数据置放(FDP)、NVMe-MI管理接口、双端口时钟(SRIS/SRNS)、ZNS分区命名空间等在内的全面测试,快速发现固件或硬件的不兼容之处。Microsoft Azure的存储负责人在新闻中表示,Azure数据中心对SSD的定制需求繁多且独特,他们与SANBlaze合作不仅满足了内部验证,还推动了OCP开源测试规范如2.5版的完善。“Certified by SANBlaze”套件目前已被UNH-IOL(新罕布什尔大学互操作实验室)采用,作为其提供OCP NVMe合规测试服务的官方工具。这意味着厂商送测的硬盘将在与SANBlaze设备一致的环境下按OCP标准进行验证,从而确保测试结果具有权威性和一致性。除了SSD合规测试,SANBlaze还在其平台中加入了对最新NVMe 2.0/2.1特性的支持,以及针对未来PCIe Gen6 NVMe设备的预研能力。更高层次上,OCP存储项目组在本次峰会上也设置了专题讨论,涵盖QLC闪存的大容量盘优化、GPU直连存储的架构、CPU优化NVMe性能的方法,以及OCP存储测试和EDSFF新规格的更新等。通过这些讨论与工具的发布,可以看到开放计算社区正打造一个完整的存储生态检验闭环:从规范制定到厂商产品,再到测试认证,都有明确的流程和工具支撑。例如某SSD通过“Certified by SANBlaze”测试套件验证合格后,即表明其满足OCP规范的严格要求(包括可靠性、性能和安全特性等),数据中心用户即可更加放心地将其部署到大规模生产环境中。展望未来,随着PCIe 5.0/6.0 SSD、CXL内存扩展设备等不断涌现,此类标准化的合规测试对行业健康发展将愈发重要。而SANBlaze等工具的完善,为OCP推进开放存储标准的落地提供了坚实保障。

最后,通过本次峰会的综合信息可以看出,开放计算正引领数据中心技术向更开放、更高速、更高效的方向演进。从中国企业的积极参与到全球厂商在PCIe/CXL、AI加速、液冷以及测试规范上的协同创新,OCP生态体系正在形成一个良性循环。正如大会主题所言:“Leading the Future of AI”——开放合作将是迎接AI时代挑战、构建下一代基础设施的关键途径。本次峰会传递出的各种热点和趋势,无疑为无法亲临现场的技术人士提供了一幅当今数据中心前沿技术全景图。借助上述导读,读者可对OCP峰会上涌现的热门公司和技术亮点有全面了解,把握开放计算领域的最新脉动。

资料来源:等 OCP Summit 2025 官方发布及相关报道。

更多关于PCIe 6.0/CXL的测试工具和技术,请下载Saniffer公司2025.6.16最新更新的白皮书12.3版本 - 《PCIe5&6.0, CXL, NVMeNVMoF, SSD, NAND, DDR5, 800GE测试技术和工具白皮书_ver12.3》。
白皮书下载链接 (或者点击下面的二维码直接下载):

https://pan.baidu.com/s/18_c11aeFhSBe2qa-jUFs_Q?pwd=mm9y 提取码: mm9y

图片

如果你有其任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的我问题想咨询,请访问:访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品;或者添加点击左下角“阅读原文”留言,或者saniffer公众号留言,致电021-50807071 / 13127856862,sales@saniffer.com。

图片