【高清视频】PCIe 6.0 x16故障注入卡真实环境演示
2025-05-21 13:36:17
我们昨天发布的《手把手教你使用如何构建PCIe 6.0链路进行RC和EP测试》演示了两张PCIe 6.0 switch串在一起构建了非常稳定的PCIe 6.0 x16链路。我们今天在两张卡中间串接一个Quarch公司发布的PCIe 6.0 x16故障注入卡,看看两张Gen6 switch卡是否还可以稳稳地建链在PCIe 6.0 x16?想获得答案的朋友直接参考下面的视频。
我们花费2个小时拍摄了本期视频并处理添加了中、英文字幕供大家参考,参见下面的视频,如果想看高清视频一定要在电脑上打开上面的视频链接进行观看!如果你觉得这篇文章对你有帮助,也希望帮助到更多人,欢迎分享到朋友圈或者与朋友讨论!
下面是我们根据上述的视频整理的一个文字总结,供参考。

Quarch PCIe 6.0 x16 故障注入卡系统级演示总结

时间:2025/5/20
测试环境:基于AMD平台的PC主板 + SerialCables PCIe Gen6 x16 Switch ×2 + Quarch故障注入模块

一、概述

随着PCIe Gen6技术的普及,行业对链路完整性测试、协议容错验证与Bit Error容忍度的需求大幅提升。英国Quarch公司推出的PCIe 6.0 x16故障注入模块,为开发者提供了一种非侵入式、可编程、高带宽的信号扰动手段。

本次演示系统通过两张SerialCablesGen6 x16 Switch卡构建链路通路,并在两者之间串接Quarch故障注入模块,实现对部分lane的信号注入控制。本文将对设备结构、连接方式、功能机制及演示效果做详细说明。

二、故障注入模块简介

产品型号说明:

以本次演示使用的模块为例:

  • 型号:PCIe x16-1
    • 表示仅对 lane0 进行故障注入
    • 其他 lane1-15)为透传状态

其他型号(如 -8-16)可支持更多lane的同时注入,但价格更高,适用于更复杂的验证需求。

功能特点:

  • 支持注入:
    • 信号毛刺(glitch
    • bit error
    • CRC error
    • code violation 
      等链路层异常
  • 模块内部通过柔性PCB连接至 TestMonkey 控制器
  • 控制器通过USBPC连接,结合Quarch控制软件实现故障事件的精准配置与实时执行

三、测试拓扑结构与链路构建

本次系统构建以串接方式演示:

AMD 主板 → Switch A → Quarch 故障注入卡 → Switch B

具体连接细节:

  • 主板:
    • 使用 AMD PC 主板
    • 选用离 CPU 最近的 PCIe 插槽,确保最大链路能力
    • 为适应测试空间布局,通过 PCIe 延长线 将主板信号引出
  • Switch A(下层Switch):
    • 通过PCIe Gen5 x16金手指插入主板
    • 上层插槽直接连接 Quarch 故障注入模块的金手指部分
    • 蓝色LED闪烁状态 → 表示 建链成功但未达到Gen6(实际Gen5 x16
  • Quarch 故障注入模块:
    • 串联在Switch ASwitch B之间
    • 实际运行配置导入signal glitch的仅限于 lane0,其余 lane 透传
    • 串联后整体仍可实现 Gen6 x16 稳定建链(见后文验证)
  • Switch B(上层Switch):
    • 接在Quarch模块输出端
    • LED常亮 → 表示链路协商稳定
    • 实际与Switch A之间通过 Quarch 建立了 Gen6 x16链路

四、控制与验证方法

1. 故障注入模块控制

  • 使用 Quarch  TestMonkey管理模块
  • 柔性排线(管理使用)连接至故障注入卡
  • 通过 USB 连接管理主机
  • 控制软件支持定义:
    • 注入类型(glitchbit errorCRC error
    • 注入方向(Tx/Rx
    • 注入时间点与持续时长

2. Switch卡链路状态验证

  • Switch
    卡支持USB Type-C管理口
  • 使用 Tera Term 等串口终端连接后发送命令:

showport

输出示例:

  • Golden Finger: Gen5 x16

  • Port 80: Gen6 x16

表示:

  • Switch A 与主板之间为 Gen5 x16
  • Switch A 通过Quarch故障注入模块连接 Switch B 时,仍成功协商为 Gen6 x16

五、注入效果演示

通过将故障注入集中在 lane0,可演示以下情景:

 
 
 
 

故障类型

说明

bit error

模拟链路信号比特翻转

CRC error

模拟包尾校验失败

code violation

模拟不符合PCIe编码规范的信号

glitch(毛刺)

模拟模拟信号短时间异常

掉帧(drop frame

可模拟未响应或包丢失

注入端与接收端均可选择,并可观察对端是否发生链路恢复、端口错误计数增加或中断上报等行为。

六、演示结论与价值

  • 模块本身表现稳定:
    • 尽管在lane0注入故障,其余lane保持透传
    • 整体仍能完成Gen6 x16的高带宽链路建立
  • 实现了低侵入、高可控的验证方式:
    • 无需修改主板或Switch
    • 灵活选定注入方式与通道,快速测试协议鲁棒性
  • 适合以下场景:
    • 芯片级 PCIe PHY 层误码容忍度验证
    • 交换芯片与Retimer开发阶段的边界条件测试
    • PCIe 6.0系统完整性分析与仿真对比验证

七、后续建议与拓展方向

  • 可替换为更高级别版本(如x16-8x16-16)实现多通道并发导入故障
  • 可结合逻辑分析仪、协议分析仪(如SerialTek)实时捕获异常行为
  • 可脚本化执行批量扰动,导出统计报表,用于自动化QA测试场景

八、技术术语注解

缩写术语

含义

PCIe

Peripheral Component Interconnect Express,外围组件互联高速标准

Gen6 x16

表示PCIe6代协议、16通道,带宽为128GT/s×16

Lane

每一个PCIe的双向通道,单通道为x1

Quarch

英国一家专注于测试与故障注入设备的供应商

TestMonkey

Quarch的控制模块,用于管理注入卡

如需进一步了解产品价格、交货周期或样卡申请,可联系销售团队或访问网站www.saniffer.cn或者参考下面的内容获取更多信息。
更多关于PCIe Gen6的测试工具和技术,请下载我们2025/4/23最新更新的白皮书12.2版本 - 《PCIe5&6.0, CXL, NVMeNVMoF, SSD, NAND, DDR5, 800GE测试技术和工具白皮书_ver12.2》。本视频演示的产品请参考章节5.1
下载链接:

链接: https://pan.baidu.com/s/1yHkvnrrWhAiZNxt9CQ4cfA?pwd=n66k 提取码: n66k

如果你有其他任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的问题想咨询,请访问:访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品;或者添加saniffer公众号留言,致电021-50807071 / 13127856862,sales@saniffer.com。

图片