logo
  • 首页
  • 产品中心
  • 解决方案
  • 技术专栏
  • 关于我们
  • 首页
  • 产品中心
  • 解决方案
  • 技术专栏
  • 关于我们
  • 【高清视频】如何分析PCIe 5.0 U.2 SSD的真实功耗?Quarch PAM工程实战

    我们之前做过好多期如何使用PAM (power analsysis module)来测试和验证PCIe/NVMe M.2 SSD,尤其是其低功耗L1.2的状况,感兴趣可以翻看一下我们公众号saniffer之前拍摄的视频讲解,例如:【高清视频】如何有效分析笔记本电脑的低功耗?其实,我们的企业级eSSD客户也在大量使用PAM进行企业级SSD功耗测量。消费类M.2 SSD低功耗的考量主要是笔记本/pad等产品的电池技术没有获得突破,但是企业级尽管不考虑这么低的功耗,平时SSD都是随时待命,但是如果可以降低同等I/O性能下面的功耗还是有很大的经济消息,毕竟你如果拿到AI训练和推理的大环境下想想数据中心现在最缺的不是GPU算力卡,而是电力!像之前我们国内第三方Lab益企研究院拿我们的PAM测试了Intel/Solidigm的企业级SSD视频:益企研究院使用Quarch PAM测量企业级SSD省电模式。我们今天的高清视频就是在实验室里面使用PAM给你做了一个简单展示,如何使用PAM来量测Gen5 U.2 SSD功耗,当然,管理软件QPS (Quarch Power Studio)这块讲解非常简单和基础,如果你想了解PAM使用的QPS的更加详细的内容,可以参考我们之前拍摄的一个大概20多分钟的高清讲解视频:【高清视频】如何监控和快速分析各类接口SSD和PCIe 插卡的功耗、sideband信号? 00:00:00-00:02:42 软件如何连接到PAM00:02:42-00:03:16 PAM设备信息查看00:03:16-00:03:46 PAM设备支持的信号00:03:46-00:12:28 PAM如何开启抓取00:12:28-00:13:30 PAM视图查看00:13:30-00:15:28 PAM瞬时值分析00:15:28-00:16:54 PAM区域统计值查看00:16:54-00:17:57 PAM分段统计查看00:17:57-00:20:38 PAM信息标注Annotation00:20:38-00:22:58 PAM通道synthetic channel00:22:58-00:25:08 PAM抓取内容保存00:25:08-00:25:56PAM抓取内容保存(2)00:25:56-00:28:54 PAM Python开发我们今天下面的视频综合了:我们演示的PCIe 5.0 U.2 PAM 视频的讲解内容Quarch 的PAM + Quarch Power Studio管理软件的功能我们之前公众号经常讨论过的 U.2 SSD / PCIe SSD / 企业级SSD测试问题你可以看到,该PAM工具的一个非常突出的特点是具备 PAM同时监控功耗 + sideband信号 的能力,这也是它与普通功耗分析仪一个非常大的区别。一、背景:为什么需要U.2 SSD功耗与Sideband联合分析在 AI服务器、企业级存储服务器以及NVMe测试环境中,U.2 SSD仍然是最常见的企业级SSD形态之一。U.2接口标准:• 连接器:SFF-8639• 协议:PCIe / NVMe• 通道:PCIe x4典型应用:• NVMe All-flash array• AI训练数据存储• 数据中心数据库• GPU服务器缓存盘例如:• Samsung PM1743 PCIe 5.0 NVMe SSD• Kioxia CM7• Solidigm D7但是在企业级SSD验证过程中,经常会遇到几个问题:1 功耗问题企业级SSD在不同状态下功耗差异巨大:状态功耗Idle3WMixed IO10WFull write20W+需要精确分析:• 电压• 电流• 瞬时功耗2 Sideband信号问题U.2 SSD除了PCIe高速信号外,还包含大量sideband信号:常见包括:• PERST#• PRSNT#• CLKREQ#• SMBus这些信号对于:• SSD初始化• Reset行为• Power management都非常关键。3 企业级SSD调试难点传统设备通常只能做:• 功耗测试或• 协议分析但很难做到:功耗 + PCIe sideband同步分析而Quarch PAM正是解决这个问题的工具。二、Quarch PAM:Power Analysis ModulePAM 的全称是:Power Analysis Module它是一款专门用于 PCIe设备功耗分析与Sideband监测 的设备。视频中首先展示了PAM管理模块的结构。PAM前面板包括:• 状态指示灯• Action灯• Trigger In / Trigger Out• USB-C连接接口。其核心作用是:采集测试治具中的电压、电流、Sideband信号并传输到电脑。PAM本身只负责:• 数据采集• 数据打包• USB / Ethernet传输数据最终由软件显示。三、U.2 SSD测试系统结构视频演示的测试环境是一个简化的PCIe服务器结构。系统拓扑如下:CPU │PCIe slot │PCIe→ U.2转接卡│PAM U.2Fixture│U.2NVMe SSD视频使用的SSD:Samsung PM1743 PCIe 5.0 x4 NVMe SSD转接卡来自:SerialCable PCIe 5.0 U.2 adapter。在正常情况下:PCIe slot → U.2 SSD但为了分析功耗,需要插入:PCIe slot →Adapter→ PAM Fixture→ SSD这个 PAM Fixture 是一个关键部件。四、PAM U.2 Fixture 的作用PAM Fixture 的位置:串接在SSD和U.2接口之间其功能包括:1 电压测量例如:• 12V rail2 电流测量实时测量:• SSD瞬时电流3 功耗计算软件实时计算:Power=Voltage×Current4 Sideband信号监测例如:• PERST• PRSNT• CLKREQ这些信号通过fixture采集。5 数据传输采集的数据通过:柔性排线 (FPC)传输到PAM管理模块。再通过USB或网络发送到PC。五、Power Studio软件PAM的数据展示和分析通过软件完成:Quarch Power Studio软件运行在PC上。连接方式:• USB• Ethernet。1 软件界面结构软件左上角显示:• PAM型号• Serial number• Fixture类型例如:2788Gen5 SFF8639 Fixture表示:PCIe 5.0 U.2测试治具。2 Channel选择Power Studio支持大量通道:包括:电压• 12V• 5V电流• rail current功耗• power channelsideband• PERST• PRSNT用户通常只选择自己关注的通道。六、实时采样能力Power Studio支持非常高的采样率。最小采样周期:4 µs常见设置:• 16 µs• 100 µs• 1 ms。在视频中演示使用:约1.024 ms采样。采样率越高:• 数据越精细• 数据量越大例如:4µs采样时数据增长非常快。七、波形分析能力Power Studio提供类似示波器的功能。1 Auto Scroll实时显示数据流。波形持续滚动。2 区域放大用户可以拖动窗口:选择一段时间上方窗口自动放大。3 Summary统计软件可以统计:• 平均电压• 平均电流• 平均功耗• Sideband状态。4 Cursor测量用户可以选择两个点:计算:ΔtimeΔvoltageΔcurrentΔpower例如:Δtime =51.2 msΔpower =1.395 W这种功能在分析:• SSD IO burst• power transient时非常重要。八、数据记录与存储Power Studio支持长时间记录功耗数据。但需要注意:1 数据量采样率越高:数据量越大。例如:4 µs采样会快速占满磁盘空间。2 自动停止机制软件默认设置:当剩余磁盘空间低于:520MB自动停止记录。3 Recording保存默认情况下:关闭软件时可能删除trace。建议设置:recording结束时提醒保存避免数据丢失。九、PAM在U.2 SSD验证中的价值对于企业级SSD开发和验证来说,PAM有几个关键价值。1 SSD功耗分析可以分析:• idle power• IO burst power• write amplification power特别是:PCIe 5.0 SSD功耗可以达到:25W+2 Reset行为分析例如:PERST# 拉低SSD reset功耗变化可以同时观察。3 Sideband行为分析例如:PRSNTCLKREQSMBus这些信号对服务器SSD非常关键。4 服务器功耗调试特别是在AI服务器中:U.2 SSD数量可能:24/48/96功耗行为非常复杂。PAM可以帮助分析:• power spike• idle state• power gating十、PAM与PCIe Analyzer的互补关系在企业级SSD调试中通常需要两类工具:工具用途PCIe Protocol Analyzer协议分析Quarch PAM功耗分析例如:PCIe link training↓NVMe command↓IO burst↓Power spikePAM可以验证:IO行为与功耗变化的关系十一、总结Quarch PAM 是目前PCIe生态中非常独特的一类测试设备。其核心能力是:同步分析• 电压• 电流• 功耗• PCIe sideband信号在 U.2 SSD、NVMe SSD 和 AI服务器验证中具有重要价值。特别适用于:• 企业级SSD开发• PCIe设备验证• 数据中心硬件测试• NVMe性能调优对于像你们这样的 PCIe测试工具生态(SanBlaze / SerialTek / Quarch / PCIe Analyzer) 的客户来说:PAM往往是:功耗验证环节的关键工具。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND,新型存储技术NVM(RRAM/ReRAM, FRAM/FeRAM, MRAM, PCM, 3D-NOR, SRAM/DRAM等) DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-22 14:16:56
  • 【每日一题】经济型PCIe 5.0扩展平台有多猛?13个PCIe插槽 + 海量MCIO接口实测曝光

    近期由于基于Broadcom PCIe 5.0和6.0 switch芯片的扩展板的短缺,有些用户实验室测试的时候希望找一些可替代PCIe 5.0扩展卡、板、模块,上个周我们工程师在实验室拍摄了三期高清视频,重点介绍了今天你看到的这款“经济型”的PCIe 5.0扩展卡供大家参考,由于视频较大,超过3GB字节,需要单独处理添加字幕,今天的文章暂时无法添加该视频,回头看看如果感兴趣想获取该视频的朋友较多,我们将再次写篇文章添加该高清视频。下面是我们按照上面的视频高清演示的时间顺序整理的文稿,供大家快速阅读了解这套扩展板的基本的连接和使用。经济型PCIe 5.0 Switch + Retimer平台演示这次演示主要围绕一套经济型PCIe 5.0扩展验证平台展开,包括:一块高扩展性的经济型PCIe 5.0 Switch扩展板;一块经济型PCIe 5.0 Retimer卡;配合MCIO高速线缆;外接GPU、NVMe SSD等设备;用于AI、服务器、存储以及PCIe生态验证测试。整套方案最大的特点,就是:经济性 (相比于业内顶流Broadcom)高扩展能力接口极其丰富适用于复杂PCIe验证环境整个演示从Retimer卡开始,再到Switch平台结构、连接方式、供电散热,最后进行GPU实际连接演示,逻辑非常完整。一、首先介绍经济型PCIe 5.0 Retimer卡演示一开始,先介绍了一块经济型PCIe Gen5 Retimer卡。这张卡的结构非常直接:下方是一个 PCIe Gen5 x16 金手指;右侧扩展出两个 Gen5 x8 MCIO接口;通过MCIO线缆与其他设备连接。相比很多传统Retimer板卡,它并没有采用Straddle Mount结构,而是更加偏向工程验证环境中的灵活扩展。二、一张Retimer卡,同时兼容GPU与NVMe SSD整个演示里面,一个非常关键的设计点是:这张Retimer卡同时支持:GPU/加速卡NVMe SSD两种完全不同的下游设备模式。它内部已经预烧录了:板卡模式 FirmwareSSD模式 Firmware用户不需要重新刷固件。真正切换模式的方法非常简单:接GPU/板卡跳线帽接第一组BIOS配置为完整x16模式接NVMe SSD跳线帽改到第二组BIOS开启Bifurcation将x16拆分为4个x4这样一块卡就能扩展:GPURAID网卡U.2 SSDEDSFF SSD等多种设备。这一点其实非常适合:SSD研发实验室AI服务器验证PCIe Gen5兼容性测试CXL生态验证高速信号链路调试三、重点来了:经济型PCIe 5.0 Switch扩展板真正“重量级”的部分,是后面的经济型PCIe 5.0 Switch扩展板。演示里面提到:整个平台一共提供:PCIe插槽共13个PCIe插槽MCIO接口7组MCIO接口外加2个独立MCIO接口整个板子属于典型的“超高扩展型PCIe平台”。对于很多做:AI训练GPU集群PCIe验证存储扩展多设备互联的研发团队来说,这种平台非常有吸引力。四、双Switch芯片架构设计演示中特别强调:这块板并不是单Switch设计。而是:Switch0Switch1两颗Switch芯片组合而成。但它们并不是简单“一人管一半”。而是:不同插槽不同MCIO不同下游Port交叉组合。这种设计意味着:平台支持非常灵活的拓扑结构例如:单CPU → 单Switch单CPU → 双Switch并联单CPU → Switch级联双CPU → 双Switch多GPU共享PCIe Tree等等。五、支持Switch级联(Cascade)整个演示里面最值得关注的部分之一,就是:两颗Switch可以级联工作演示人员专门解释:其中一组MCIO接口,并不是普通Device接口。而是:专门用于Switch0与Switch1互联通过MCIO线:将Switch0下游Port接到Switch1上游Port从而形成:更大的PCIe Tree结构这对于:AI训练GPU扩展大规模推理多GPU互联验证尤其重要。因为很多AI场景,本质上都需要:更多GPU更大PCIe拓扑更多Peer-to-Peer通信六、专门考虑GPU厚度与AI应用演示中还提到一个非常“工程化”的细节:插槽间距并不是平均分布原因是:GPU太厚了。因此:两侧插槽间距更宽方便插双宽GPU中间区域则更紧凑更适合网卡、RAID卡等设备这个细节其实很能说明:这块板的设计目标,本来就是AI/GPU场景而不是简单“做几个PCIe槽”。七、供电与散热设计由于板卡支持大量设备扩展,因此:板上提供了4组CPU 8Pin供电接口并且:支持按需供电GPU可使用独立供电PCIe插槽也可为设备供电演示中甚至讨论了:一个插槽75W多卡总功耗计算如何决定接几个8Pin供电这些内容已经非常接近真实实验室使用场景。同时:板上还设计了:4组风扇接口温度监控CPLD控制状态灯整体明显是偏向研发测试平台设计。八、最后进行了GPU实机演示最后部分,演示人员:使用Intel PCIe Gen5服务器搭配国产摩尔线程GPU (2倍厚度)通过MCIO线连接Retimer与Switch实际进行设备连接演示过程中还重点讲解了:Lane顺序MCIO方向0~7 / 8~15 Lane对应线缆连接方式卡扣固定散热风扇摆放这些内容,对于第一次接触:MCIOPCIe Gen5GPU扩展平台的工程师,非常有参考价值。九、整个演示最大的几个价值1)PCIe 5.0生态正在快速成熟这次演示最明显的一点,就是:本次介绍的经济型PCIe Gen5扩展板,已经不仅仅停留在:单块板卡单设备验证而是开始进入:高速互联AI扩展多GPU大规模PCIe拓扑阶段。2)平台灵活度非常高这套平台可以:接GPU接NVMe SSD接RAID卡接网卡接AI加速卡并且支持:MCIO扩展Switch级联多Host多Device灵活度已经很高。3)非常适合AI服务器验证从插槽布局到供电设计,再到GPU间距。都能明显感觉:这块板主要面向AI服务器验证场景特别适合:多GPU测试PCIe Gen5验证AI推理训练平台GPU兼容性测试高速互联调试4)MCIO正在成为Gen5/Gen6时代的重要接口整个演示几乎反复围绕MCIO展开。包括:Host连接Switch互联GPU扩展SSD扩展这也说明:MCIO已经成为PCIe Gen5/Gen6时代的重要物理接口之一。尤其在:AI服务器GPU平台EDSFF SSDPCIe扩展领域越来越常见。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND,新型存储技术NVM(RRAM/ReRAM, FRAM/FeRAM, MRAM, PCM, 3D-NOR, SRAM/DRAM等) DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-21 14:09:06
  • 【深度研究】谁在中国大陆研究各类新型存储技术:ReRAM, FeRAM, MRAM, PCM, 3D-NOR等等?

    最近研究中国近20年在各类新型存储技术NVM (Non Volatile Memory)的基础研究、技术开发、市场化的过程中,发现将这些原来很分散的内容总结以后,不仅对于深入了解业内知名的测试新型存储产品和技术的TestMesh如何有效帮助这些研究机构大大提高测试效率方面,同时对于从事该领域的人可能也有一定的帮助和借鉴,尤其是相关的高校、科研院所以及企业。想直接查看中国NVM产业“谁是谁,谁干了什么?”的可以直接滑过下面关于“比传统仪器测试NVM提高验证效率9000倍的”TestMesh的一些精简介绍,直接跳到本文中间开始的"组织总表(大陆+港澳,约70+条目)"查看我们统计的国内高校、科研院所、企业发布的关于关于NVM的研究和论文情况。中国新型非易失性存储 NVM 生态地图本文以中国(大陆+香港+澳门)为范围,围绕 FeRAM/FRAM、FeFET(HfO₂铁电体系为主)、MRAM(STT/SOT/eMRAM)、ReRAM/RRAM(含忆阻器与交叉阵列/存内计算)、PCM(相变存储)、PMRAM(以垂直各向异性/自旋轨道力矩路线为主的MRAM变体)、以及NOR Flash改进(含3D‑NOR与嵌入式Flash/eFlash),梳理了可公开核实的组织清单(约70+条目),供大家参考。下面首先介绍一下我们前提到的TestMesh是个啥工具:TestMesh:其“极高速算法循环(algorithmic cycling)+硬件时序/判决(1‑bit ADC、硬件sequencer)+微秒级配置/纳秒级采样”的架构,直接对应新型NVM在“可靠性/耐久/漂移/阵列状态可视化/盲测循环/交叉阵列拓扑与扰动”方面的研发痛点。中国本土在 RRAM/eRRAM(含存算一体) 与 NOR(含3D‑NOR) 方向出现了“科研突破→IP/芯片→量产/试产”的明显链条:例如中科院微电子所公开披露了 3D NOR阵列验证 与 28nm嵌入式RRAM IP量产落地 等里程碑,意味着“工程化测试平台”会逐步成为刚需。近期(2024–2026)对TestMesh的调研以及其在欧洲市场和美国市场的应用客户来讲,它的价值对于下面这技术和应用的极高效测试和验证助益非常大:特色工艺/Foundry(eFlash、48nm/55nm NOR、eRRAM/eMRAM)、NOR Flash设计公司(车规、xSPI、宽电压/低电压)、RRAM/MRAM/PCM初创与产业化项目,以及少数具备芯片级阵列/宏单元流片能力的头部高校与国家队研究所。我们最近的一次针对NVM新型存储device测试的技术交流中给出一个典型对比案例:同一测试流程在传统通用仪器链路上“耗时43小时”,而在TestMesh上“只用3分钟”,并明确称“速度提升了9000倍”。方法与口径说明本报告以“可核验”为原则:优先使用组织官网、大学/研究所新闻与成果页、论文出版方页面(Nature/Science/ACS/Springer等)、以及专利数据库(Google Patents)等一手或准一手来源;对媒体/二手转载如无更高质量佐证,则仅作为“融资/新闻”参考。对每个条目,若某字段无法从公开来源确认,则标注 “未说明”(按用户要求)。“TestMesh优先级”是为“潜在客户拓展”服务的商业评分,依据:是否存在 器件/阵列/宏单元 的反复循环、可靠性、漂移、扰动、位图与统计需求;是否具备 流片/试产/量产 或明确的“对外开放平台/服务”;是否更可能承担“设备采购决策”(如Foundry/IDM、芯片公司、国家队平台)或仅为单课题研究。TestMesh测试工具要点简介产品核心要点TestMesh(NplusT)在产品页中明确将自身定义为:面向新型NVM开发与工程化的 “开箱即用All‑in‑one工程测试平台”,强调其“突破性架构”带来的三类价值:极高速算法循环(Millions of cycles in a flash)、对cell/array状态与行为更高可视性、提升工程生产力。其实现这些特性的关键硬件/软件要素包括:高速算法波形发生器(动态阻抗控制、微秒级脉冲选择);快速电流检测电路(亚微秒级建立时间、几十纳秒采样);电流量程微秒级切换(兼顾写脉冲与读尺度);阈值可编程1‑bit ADC(用于判断单元是否达到目标态,模拟sense amplifier);可编程硬件sequencer(减少软件交互开销);覆盖 晶圆与封装级测试、GUI(工程/操作员模式)、Python/C++可编程,并可与阵列分析软件集成。TestMesh还把适用技术直接列为:Flash(含NAND/NOR/3D)、ReRAM、PCM、FeRAM、MRAM、Memristor networks 等,并给出“算法/盲测循环、可编程周期点的IV等表征、拓扑图案生成、扰动操作”等主功能,以及“工艺评估、可靠性评估、设计验证、失效分析、生产监控”等应用场景。此外,产品页给出按研发阶段优化的配置:TMS‑100(单cell)、TMA‑100(cell与mini‑array,模拟charge pump与sense amp)、TMC‑100(交叉阵列/计算阵列,漂移检测与计算操作仿真)、TMY‑100(IP宏单元与最终产品,协议化管理与在线判决)。对“为何能极快”的补充信息我们在和用户交流中有时候更强调“系统架构层”的加速逻辑:通过 低延迟高速通信(PCIe) 与 硬件侧执行/缓存/判决 思路,把大量原本在通用仪器+软件回环中的交互开销移走;给出“43小时→3分钟→9000倍”的对比例子,直观说明其面向“百万/千万/更高循环次数”测试的价值(尤其是可靠性与算法循环)。组织总表(大陆+港澳,约70+条目)为减少地名重复并便于分区统计,采用城市/区域代码:BJ北京|SH上海|SZ深圳|HZ杭州|NB宁波|WX无锡|WH武汉|ZH珠海|CD成都|XA西安|QD青岛|JN济南|CC长春|SY沈阳|NJ南京|HK香港|MO澳门|HF合肥|未说明:公开资料未能确认到城市级表内“代表论文/资料”“专利/专利页”“融资/新闻”均有引用链接;缺失则标注“未说明”。字段F01F02F03F04实体中芯国际华虹半导体上海华力微电子华润微电子城市/区域SH/BJSH/WXSHWX/SH组织类型FoundryFoundryFoundryIDM/FoundryNVM技术聚焦eFlash/eNVM55nm eFlash MCU、48nm NOR Flash55nm SONOS eFlasheFlash/特色eNVM阶段量产/平台化规模量产量产量产/平台化公开联系未说明未说明未说明未说明代表论文/资料55nm嵌入式闪存平台合作发布半年报相关披露55nm SONOS eFlash量产报道eFlash IP方案合作与工艺平台说明专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级高高高高字段F05F06C01C02实体GTA半导体武汉新芯兆易创新普冉股份城市/区域SHWHBJSH组织类型Foundry/IDMIDM/制造成熟公司成熟公司NVM技术聚焦FeRAMSPI NOR FlashSPI NOR FlashSPI NOR Flash阶段量产量产量产量产公开联系未说明未说明未说明未说明代表论文/资料110nm FeRAM量产披露SPI NOR产品页官方Flash产品页SPI NOR产品页专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级高高高高字段C03C04C05C06实体珠海博雅科技芯天下技术东芯半导体聚辰股份城市/区域ZH未说明SHSH组织类型成熟公司成熟公司上市公司上市公司NVM技术聚焦SPI/Parallel NORNOR/SLC NANDSPI NOR/SLC NANDEEPROM + NOR阶段量产量产量产量产公开联系未说明未说明未说明未说明代表论文/资料官方简介About页面官方产品中心NOR Flash产品页专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级高中-高高中-高字段C07C08C09C10实体复旦微电子江波龙士兰微北京芯斯为城市/区域SHSZHZBJ组织类型上市公司成熟公司IDMStartupNVM技术聚焦SPI NOR FlashxSPI NORMCU Flash/OTP/MTP垂直单晶3D NOR阶段量产量产/迭代量产研发/早期公开联系未说明未说明未说明未说明代表论文/资料SPI NOR Flash产品页xSPI NOR新品说明官方新闻/产品线3D NOR创业方向报道专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中-高中-高中高字段M01M02M03R01实体上海矽朋微电子浙江驰拓科技致真存储昕原半导体城市/区域SHHZBJSH/SZ/HZ组织类型StartupStartupStartupStartupNVM技术聚焦MRAMeMRAMSOT-MRAMeReRAM阶段原型/产业化推进原型/平台服务原型/推进量产产业化/平台化公开联系未说明sales@hikstor.comtruthmemory@tmc-bj.cnsales@innostar-semi.com代表论文/资料官方页面官网官网联系方式页销售网络/联系方式页专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级高高高高字段R02R03R04R05实体新忆科技铭芯启睿显芯科技集创北方城市/区域BJBJBJBJ组织类型StartupStartup成熟公司成熟公司NVM技术聚焦RRAMRRAMeRRAM IPeRRAM阶段原型/推进研发/早期量产量产公开联系未说明未说明未说明未说明代表论文/资料官网技术说明Pre-A融资报道28nm eRRAM IP新闻28nm先进显示芯片披露专利/专利页未说明未说明未说明未说明近年融资/新闻未说明Pre-A未说明未说明TestMesh优先级高中-高高高字段E01P01P02A01实体无锡顺旻智存北京时代全芯芯连鑫(武汉)半导体知存科技城市/区域WXBJWHBJ/HZ组织类型Startup/产业化成熟公司StartupStartup/成熟产品NVM技术聚焦FeRAMPCM3D PCM存内计算阶段量产产业化研发/启动量产/试量产公开联系未说明未说明未说明sales@witmem.com代表论文/资料110nm FeRAM量产披露知识产权页武汉官方签约信息公司介绍与联系方式专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明项目签约产业合作/采样新闻TestMesh优先级高高高中-高字段I01I02I03I04实体中科院微电子所中科院物理所中科院金属所北京微电子技术研究所城市/区域BJBJSYBJ组织类型研究所研究所研究所研究所NVM技术聚焦3D-NOR/RRAMSOT-MRAMHfO₂铁电eRRAM耐久阶段研究→量产研究研究原型/工程化公开联系未说明未说明未说明未说明代表论文/资料3D NOR成果SOT-MRAM科研动态HZO超薄铁电论文Nature Electronics亮点专利/专利页未说明CN200910076048.X未说明未说明近年融资/新闻量产落地未说明未说明未说明TestMesh优先级高中-高中高字段I05I06I07I08实体浙江实验室甬江实验室ACCESS-AI Center中科院上海技物所城市/区域HZNBHKSH组织类型研究机构实验室研究中心研究所NVM技术聚焦FeFETRRAM/忆阻器自旋器件神经形态器件阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料FeFET论文Nature Comm论文npj SpintronicsTongji-SITP论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中中中中字段U01U02U03U04实体清华大学北京大学复旦大学浙江大学城市/区域BJBJSHHZ组织类型大学大学大学大学NVM技术聚焦RRAM/CIM忆阻器阵列神经形态器件RRAM/HfO₂阶段研究/样片研究/样片研究/样片研究公开联系未说明未说明未说明未说明代表论文/资料忆阻器存算一体成果集成电路学院成果Nano Letters论文Nature Comm论文专利/专利页未说明未说明未说明未说明近年融资/新闻成果报道未说明未说明未说明TestMesh优先级高高高中-高字段U05U06U07U08实体华中科技大学西安交通大学西安电子科技大学中国科学技术大学城市/区域WHXAXAHF组织类型大学大学大学大学NVM技术聚焦RRAM/忆阻器阵列MRAM/自旋轨道FeFET/铁电可靠性HfO₂铁电相阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料HfO₂-x阻变存储论文Spin Hall角论文铁电疲劳机制论文HfO₂铁电相变论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中-高中-高中中字段U09U10U11U12实体哈尔滨工业大学(深圳)西湖大学南京大学华南师范大学城市/区域SZHZNJGZ组织类型大学大学大学大学NVM技术聚焦HfO₂铁电超薄HfO₂铁电机理铁电/类脑器件全铁电类脑系统阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料HZO超薄铁电论文HfO₂铁电论文全铁电储备计算论文全铁电储备计算论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中中中低-中字段U13U14U15U16实体华南理工大学深圳大学同济大学山东大学城市/区域GZSZSHJN组织类型大学大学大学大学NVM技术聚焦光电忆阻/类突触忆阻器视觉系统神经形态器件HfO₂铁电/忆阻器阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料光学突触器件论文仿复眼忆阻器论文Nature Comm论文HfO₂稳定性论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级低-中中低-中中字段U17U18U19U20实体吉林大学天津大学济南大学青岛大学城市/区域CCTJJNQD组织类型大学大学大学大学NVM技术聚焦光电忆阻忆阻器/光电器件忆阻器/光电器件HfO₂铁电/薄膜阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料光电忆阻论文TJU论文索引UJN论文索引HfO₂相关论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级低-中低-中低低-中字段U21U22U23U24实体西北工业大学中国科学院大学香港大学香港科技大学城市/区域XABJHKHK组织类型大学大学大学大学NVM技术聚焦忆阻器/柔性类脑忆阻器/类脑材料新型器件/存内计算自旋类忆阻阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料Nature Comm论文Perovskite论文Nature Comm论文npj Spintronics专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中低-中中中字段U25U26U27U28实体香港理工大学香港城市大学香港中文大学香港中文大学(深圳)城市/区域HKHKHKSZ组织类型大学大学大学大学NVM技术聚焦Perovskite memristor二阶忆阻器Memristor-ADC自旋类忆阻阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料Nature Comm论文Nature Comm论文Nature Comm论文npj Spintronics专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级中中中中字段U29U30U31U32实体澳门大学澳门科技大学北京航空航天大学北京理工大学城市/区域MOMOBJBJ组织类型大学大学大学大学NVM技术聚焦2D材料忆阻器忆阻器研究SOT-MRAM/忆阻器HfO₂铁电阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料Nature Electronics论文活动/论文索引SOT-MRAM论文HZO结晶论文专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级低-中低中-高中字段U33U34U35U36实体安徽大学北京科技大学合肥工业大学南京邮电大学城市/区域HFBJHFNJ组织类型大学大学大学大学NVM技术聚焦铁电相关研究铁电相关研究光电突触/类忆阻器忆阻器相关研究阶段研究研究研究研究公开联系未说明未说明未说明未说明代表论文/资料HfO₂铁电论文HZO结晶论文光电突触论文Nature Comm参考PDF专利/专利页未说明未说明未说明未说明近年融资/新闻未说明未说明未说明未说明TestMesh优先级低-中低-中低低-中注:本表并非“统计学意义的绝对全量”,而是“2016–2026更活跃、且公开信息可核验”的覆盖集合;对未能在公开渠道稳定核实的条目,本报告未强行纳入或标注为“未说明”。按技术与区域聚类表按技术方向聚类(以ID引用总表)技术方向典型需求形态(与TestMesh匹配点)覆盖ID(示例,非穷尽)NOR/eFlash/3D‑NOR高P/E循环、扰动、读写边界、阵列位图、量产监控;对微秒级流程控制与1‑bit判决极敏感F01–F06、C01–C10、I01RRAM/eRRAM/忆阻器(含交叉阵列与CIM)变异性/漂移/多级态、交叉阵列拓扑与扰动、算法循环与盲测、近阈值工作点评估R01–R05、A01、I01、I04、U01–U06、U14、U23–U28 等MRAM(STT/SOT/eMRAM/PMRAM)写入能耗/速度、耐久(常强调>10^12级)、读写分离结构评估、磁堆栈一致性与写入窗口测试M01–M03、I02、U06、U31 等FeRAM/FeFET(HfO₂铁电)疲劳/唤醒/老化、保持与温度特性、多次循环的可靠性退化路径;需要高频/高通量电学循环与关键周期点表征F05、E01、I03、U08–U13、U16、U32 等PCM多状态写入策略、漂移/保持、耐久与温度窗口;需要快速算法管理与表征结合P01–P02按区域聚类(以ID引用总表)区域板块特征主要ID(示例)北京(含亦庄)国家队研究所+头部高校+显示/存储公司密集;RRAM IP与3D‑NOR等里程碑集中I01–I04、C01、C10、M03、R04–R05、U01–U02、U22、U31–U32长三角(上海/无锡/杭州/宁波)Foundry与NOR公司聚集;eFlash平台化、eRRAM与eMRAM开放平台明显F02–F05、C02、C05–C07、M02、R01、I05–I06、U03–U04、U10、U15珠三角/大湾区(深圳/香港/澳门)自旋器件/类忆阻研究活跃;港区高校成果密集;深圳为芯片公司与应用牵引点C08、A01、U23–U30、U14、U09、U28中部(武汉)NOR制造与新型PCM项目落地;高校与产业链协同潜力F06、P02、U05西部(西安/成都)MRAM/自旋轨道与器件研究强;部分高校在MRAM/铁电方面活跃U06–U07、U21、U20(CD相关见论文单位)Top‑20 目标线索(以ID引用总表)说明:为避免重复展开组织名称,本表仅列ID与行动理由;对应名称与信息请回查“组织总表”。优先目标ID目标类型核心要点TestMesh可以提供的价值I01国家队研究所同时覆盖3D‑NOR、eRRAM IP量产、RRAM‑CIM芯片论文链路,具备“示范效应+产业外溢”“阵列级位图+算法循环+生产监控一体化”F02Foundry55nm eFlash MCU与48nm NOR规模量产平台,可靠性/量产监控需求重“从研发验证到生产监控的同一平台链路”F01FoundryeFlash/eNVM平台化合作多,客户多样,具备规模化复制机会“在不改现有ATE体系下补齐工程测试短板”F03Foundry55nm SONOS eFlash平台量产导入,宏单元测试需求明确“微秒级流程配置+硬件判决提升吞吐”F06NOR制造NOR量产与可靠性/筛选刚需“P/E‑disturb‑bitmapping快速闭环”C01NOR龙头车规与功能安全口径,测试矩阵更复杂“车规可靠性:循环加速+关键点表征自动化”C02NOR公司产品线丰富+KGD服务,TestMesh可做工程与客户验证工具“KGD/工程筛选:更快找到失效模式”C03NOR公司多工艺路线(ETOX/SONOS)+量产,适配对比验证“工艺对比与节点迁移的高效率验证”R01eReRAM公司对接客户/平台导入,“测试与表征服务”是商业化核心一环“面向客户的可复现benchmark与脚本库”R02RRAM公司官网明确RRAM与SoC/存算产品方向,适配交叉阵列与算法循环“阵列一致性/漂移/多级态测量自动化”R04显示芯片公司eRRAM量产应用侧,位图/筛选/监控需求强“量产良率提升:位图与漂移快速定位”M02eMRAM平台官网明确开放服务+联系方式清晰,成交路径短“联合打造eMRAM开放测试平台样板间”M03SOT‑MRAM公司SOT‑MRAM强调耐久与制造化,适配TestMesh硬件判决与高速循环“SOT‑MTJ阵列:高速写入‑读出窗口扫描”P02PCM项目项目刚启动,最需要“快速验证/建立测试基线”“从0到1搭建PCM测试流程/可靠性基线”P01PCM公司专利资产与产业化诉求显著,可靠性/漂移问题关键“多状态写入策略+漂移追踪的自动化方案”C103D‑NOR创业公司方向与TestMesh“面向NOR改进与快速验证”高度同频“3D‑NOR阵列快速Bring‑up与算法循环工具链”U01头部高校芯片级忆阻器CIM与系统成果多,可做标杆案例与生态牵引“作为‘高校‑产业’示范实验室共同发布案例”U02头部高校忆阻器阵列与系统成果与对外影响力强“感存算阵列‑快速位图‑算法循环闭环演示”U31自旋电子强校SOT‑MRAM与自旋器件研究突出,具备产学结合潜力“MRAM写入窗口/耐久:硬件判决与高速脉冲”U24/I07港区节点可作为港区切入与国际展示窗口(论文单位链)“港区联合示范/Workshop切入”生态关系图与里程碑时间线    图中仅使用ID(对应“组织总表”),便于与表格交叉检索。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND,新型存储技术NVM(RRAM/ReRAM, FRAM/FeRAM, MRAM, PCM, 3D-NOR, SRAM/DRAM等) DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-20 09:50:24
  • 【行业现状】PCIe 6.0 研发到底进行到哪一步了?一次近3小时技术交流实录

    PCIe 5.0 / 6.0 高速接口技术交流总结我们上周二和一家从事高速网卡芯片研发的客户,围绕 PCIe 5.0、PCIe 6.0、协议兼容性测试、协议分析仪、训练器以及 Gen6 测试环境搭建等内容,进行了接近 3 小时的深入交流。参与交流的主要是客户内部负责高速接口、协议验证以及板卡研发的工程师,因此整个讨论过程非常偏底层,也涉及了不少目前 PCIe 6.0 行业内实际推进过程中遇到的真实问题。这里按照会议交流的大致顺序,把几个核心内容整理一下,供后续做 PCIe 5.0 / 6.0、AI 服务器、SSD、DPU、网卡以及高速互连研发的工程师参考。一、从 PCIe IP 开始:为什么真正自研 PCIe IP 的公司并不多?会议一开始,双方先聊到了 PCIe IP 的来源问题。客户目前主要从事高速接口研发,但底层 PCIe IP 并不是完全自研,而是采用第三方 IP。交流中提到:真正从 PHY 到 Protocol 全栈自研 PCIe IP 的公司其实并不多大部分厂商仍然依赖:SynopsysRambusAlphawaveCadence 等第三方 IP 供应商而像:AMDIntelBroadcom这种大型厂商,则更多采用内部自研 PCIe IP 团队。二、PCIe 6.0 真正大规模落地,可能还需要几年?客户目前主力产品仍然是 PCIe 5.0,PCIe 6.0 则已经开始进入下一代规划阶段。不过会议里大家其实形成了一个比较一致的观点:PCIe 6.0 真正进入大规模商用,时间并不会特别快。交流中提到:主流x86 CPU厂家内部已经有 PCIe 6.0 CPU 原型平台部分大型 OEM / ODM 厂商已经拿到原型机国内一些服务器厂商也已经开始提前布局但真正成熟量产的服务器平台:大概率仍然要等到 2028 年底以后。原因并不是协议本身的问题,而是:信号完整性主板设计散热电源验证周期CompatibilityFirmware这些问题,在 64 GT/s PAM4 条件下都会变得极其复杂。三、当前 PCIe 6.0 最大的问题:缺少真实测试环境这是会议中非常核心的话题之一。因为现在很多工程师其实都发现:PCIe 6.0 最大的问题不是“规范”,而是“环境”。真正能跑 PCIe 6.0 的:CPUSwitchSSDNICRetimer目前都极少。所以很多公司现在其实是在:“没有完整生态”的情况下开发 PCIe 6.0。交流中重点提到:目前业内大量 PCIe 6.0 Bring-up 环境,实际上是基于:Saniffer公司销售的PCIe Gen6 Switch 卡搭建的。通过:MCIOGen6 x16EDSFFCX8 800G NIC等方式,先把基础链路建立起来。四、一个很有意思的现象:加了延长线,反而更稳定会议中有一个非常典型、也非常工程化的案例。现场演示中发现:某些情况下:Gen6 网卡直接插入 Switch 板卡时,只能跑到 Gen5。但:加入特定延长线后,反而可以稳定跑到 Gen6 x16。交流里分析认为:这实际上和:阻抗匹配PresetEqualizationSI(信号完整性)都有关系。这也再次说明:PCIe 6.0 已经不是“插上就能跑”的时代。很多问题:其实已经开始进入:“毫米级 SI 调试”阶段。五、为什么现在 PCIe 6.0 Switch 卡越来越重要?会议里花了很长时间讲当前 Gen6 Switch 卡的作用。原因其实很现实:现在真正能买到的 PCIe 6.0 CPU 平台没有。所以:大量研发团队只能先用:Gen6 Switch 卡作为RC或者EP搭环境。例如:AI NICDPUSSDCXL DeviceFPGA都可以先挂在 Switch 后面做验证。甚至:SSD 厂商已经开始用这种方式:一次同时验证多块 Gen6 SSD。包括:EDSFFE3.SGen6 x4 SSD等。六、PCIe 6.0 Compatibility 测试的发展过程,比很多人想象得慢会议中非常详细地回顾了:PCI-SIG PCIe 6.0 Compatibility Testing过去几年的真实推进过程。从 2024 年6月份第一次 Preliminary FYI Workshop 开始:最早阶段其实问题非常多:设备互联失败Gen6 建链失败Analyzer 不稳定测试结果不一致FLIT Mode 问题FEC 问题Protocol Error等等。现场提到:第一批测试时,很多设备甚至连 Gen6 都跑不起来。之后经过:第二次第三次第四次第五次 Workshop问题才逐渐收敛。直到:2026 年,PCIe 6.0 协议层 CTS 才正式进入可用阶段。SerialTek成为PCI SIG官方认证的首批PCIe 6.0 协议层CTS供应商。七、为什么 SerialTek 现在越来越被关注?这部分其实是整个会议里讨论最多的内容之一。因为现场反复提到:PCIe 6.0 后,协议分析仪已经不是“抓包工具”了。而是:Bring-up 基础设施。会议里重点提到:很多传统 Analyzer:会影响链路会改变 SI会导致问题消失即:接上分析仪后,原本的问题“不见了”。这对于研发来说是非常致命的。交流中特别强调:SerialTek 当前方案采用:宇航上一种非常特殊模拟信号透传的高端分路芯片而不是:RetimerRedriver方式。也就是说:Analyzer 本身:尽量不改变原始链路行为。八、为什么很多大厂开始重新选择 Analyzer 平台?会议里分享了不少调试的真实案例。其中提到:某些团队早期使用其它 Analyzer 平台时:接入后链路异常消失无法复现问题长期定位不到根因后来不得不换成使用SerialTek公司的PCIe 5.0或者6.0协议分析仪后:问题才能重新稳定复现。这其实也说明:PCIe 6.0 已经进入:“测试工具本身也必须足够透明”的时代。九、PCIe 6.0 的另一个现实:Trace 数据量已经极其庞大会议后半段,大家还讨论了一个现实问题:Gen6 Trace 数据量太大。例如:Gen6 x1664 GT/sFLIT Mode下,长时间抓包的数据量非常惊人。因此:现在 Analyzer 的核心竞争力之一,已经变成:解码速度。交流中提到:业内传统的PCIe分析仪:抓完 一个较大的Trace 后:解码时间可能长达数小时到一两天。而新的 Gen6 平台:已经开始强调:高速解码长时间 Trace深 Buffer快速搜索能力。十、为什么现在越来越多公司开始提前布局 PCIe 6.0?虽然现在真正商用还比较早。但交流中其实能明显感受到:整个行业已经开始提前卡位。尤其:AI 服务器GPU 集群高速 SSDCXLSmartNICDPU都已经开始进入:Gen6 提前验证阶段。因为:等真正量产服务器出来时,如果再开始做:SICompatibilityLTSSMRetimerCTS已经来不及了。十一、这场交流最核心的一个感受整个交流过程中,其实有一个非常明显的感觉:PCIe 6.0 已经不再只是“高速接口”。它开始变成:一个完整系统工程。涉及:协议SI电源散热FECPAM4CompatibilityRetimerCTSTrace Analysis全部协同。尤其到了:AI 服务器GPUCXLGen6 SSD时代后,很多问题:已经不能靠:日志猜测单点分析解决。最终:还是得回到:完整的协议分析与系统级验证。总结整体来看,这次接近 3 小时的交流,其实非常真实地反映了:当前 PCIe 5.0 → PCIe 6.0 转型阶段,整个行业的真实状态。一方面:Gen6 已经开始进入研发阶段另一方面:生态仍远未成熟而:SwitchAnalyzerExerciserCTSSICompatibility正在成为整个产业链最关键的基础设施。对于:SSDDPUAI 服务器网卡CXL研发团队来说,未来几年:“谁能更早建立稳定的 Gen6 调试环境”,可能会直接决定产品推进速度。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND, DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-18 10:45:51
  • 【现场演示】PCIe 5.0 x16 协议分析仪两小时现场 Demo 全记录

    PCIe 5.0 x16 协议分析仪现场技术交流与 Live Demo昨天下午,我们在客户会议室现场,围绕 SerialTek PCIe 5.0 x16 协议分析仪,做了一次持续两个多小时的技术交流与实际 Live Demo。整个过程既包括硬件设备展示、Interposer 连接、协议抓包演示,也包括大家非常关心的:LTSSM 状态分析L1.2 低功耗抓包信号高保真长时间 Trace 抓取远程访问解码性能Gen5 信号完整性SSD / 网卡 / FPGA 场景等问题。因为现场参与交流的工程师里,也有第一次真正接触 PCIe Gen5 Analyzer 的同事,所以这次交流整体上并没有一开始就直接进入协议细节,而是从“协议分析仪到底是干什么的”开始,一步一步往下展开。下面按照今天现场交流和演示的大致顺序,把一些重点内容整理一下。一、PCIe 协议分析仪到底是干什么的?交流刚开始时,我们先从最基础的问题开始:PCIe 协议分析仪到底解决什么问题?很多第一次接触这类设备的工程师,第一反应通常是:“这是不是逻辑分析仪?” “是不是示波器?” “是不是专门抓 PCIe 波形的?”现场其实专门解释了一下:示波器、误码仪、逻辑分析仪、协议分析仪,其实是不同层次的工具最底层:示波器(Scope)误码仪(BERT)更多是:看物理信号质量。例如:眼图抖动电压SI(Signal Integrity)这些。再往上一层:是逻辑分析。而 PCIe 协议分析仪:其实已经属于:Protocol Analyzer(协议分析)它看的已经不是波形。而是:Ordered SetDLLPTLPPacketLTSSMFlow Control这些协议层行为。现场也举了一个比较容易理解的例子:示波器更像是在看“0101”的电平变化, 逻辑分析仪就是可以将电平翻译成“0101”,而协议分析仪已经是在看:“这段数据到底代表什么命令”。二、协议分析仪为什么一定需要 Interposer?后面现场重点展示了:Interposer。其实很多第一次见 PCIe Analyzer 的工程师,真正觉得“神奇”的地方,就是:为什么它能在不中断 PCIe 正常工作的情况下,把双向数据全部抓下来?这里现场专门拿了 PCIe 5.0 x16 插卡型 Interposer 做展示。整体结构其实很直观:原本:CPU ↔ PCIe Card现在:CPU ↔ Interposer ↔ PCIe CardInterposer 位于中间。它的作用:不是修改链路。而是:把上下行 PCIe 信号“分一路出来”。现场重点解释了:PCIe 5.0 x16:实际上:上行 16 Lane下行 16 Lane每个 Lane 上,都有专门的宇航上用的模拟透传分路芯片。作用:一路正常透传,一路送给协议分析仪。同时:包括:PERST#CLKREQ#REFCLKSideband等边带信号,也会通过专门 Sideband 线缆引到分析仪。三、为什么现在 PCIe 5.0 / 6.0 对“信号高保真”越来越敏感?这个其实是今天现场讨论最多的话题之一。因为现在很多工程师已经发现:PCIe 5.0 / 6.0 最大的问题,很多时候不是协议, 而是 SI。现场专门解释了:传统很多协议分析平台,内部实际上会加入:RetimerRedriver芯片。这样做的好处:是链路更容易稳定。但问题是:原本的问题可能“消失”。现场举了一个非常典型的案例:某服务器平台:不接分析仪时会掉链接上某些分析仪后问题完全消失原因其实就是:分析仪改变了原始链路行为。而今天演示的这套 SerialTek 平台,核心特点之一:就是:Signal Integrity Fidelity(信号高保真)。即:中间:不加入 Retimer。而是采用:模拟透传分路芯片。这样:如果原始链路上:有毛刺有 Recovery有 SI 问题那么:接上分析仪后,问题依旧会真实存在。这对于真正定位问题非常关键。现场也提到:很多大型服务器、SSD、芯片公司,后来重新引入这套平台,一个非常重要的原因,就是:“接上分析仪后问题不能消失”。四、为什么这套 Analyzer 和传统平台很不一样?现场后面专门拆开讲了一下:Analyzer 内部架构。这个部分大家讨论得非常热烈。传统协议分析平台:很多其实是:“抓包盒子”。抓到的数据:需要:导到外部 PC再由 PC 软件解码所以:解码速度非常依赖工程师自己的电脑。而今天现场展示的这套平台,内部实际上是一台:高性能 Linux 服务器。包括:高性能 x86 服务器CPU多线程处理FPGA BufferNVMe SSD Storage全部在分析仪内部。现场提到:Gen5 x16:如果双向高压力抓包,数据量极其惊人。传统平台:可能:导数据几小时解码几小时甚至 PC 死机而这套架构:最大的变化是:“抓包、解码、分析、存储”全部在设备内部完成。现场提到一个比较直观的例子:同样几十 GB Trace:传统平台:可能:几小时甚至更久,例如一天。而现场这套设备:往往:几分钟到十几分钟即可完成解码。五、为什么现在越来越强调浏览器管理?后面现场还重点演示了:Browser浏览器远程访问。这个部分其实不少工程师觉得很方便。因为传统平台:通常:必须装 Windows Client必须特定版本VNC专用软件比较重。而这套平台:直接:浏览器登录,建议Chrome或者微软Edge。只要:PCLinuxMac手机能访问网络。直接输入 IP:即可进入 Analyzer 管理界面。现场也演示了:IP 配置Browser 登录管理界面Analyzer 状态识别等。包括:Interposer 接入后:系统会自动识别:UpstreamDownstreamPCIe x16Interposer 类型这些信息。六、关于 LTSSM:为什么大家越来越重视?后面交流开始进入:PCIe 调试核心问题。也就是:LTSSM。现场有工程师专门提到:现在很多 PCIe 问题:其实协议本身并不复杂。真正复杂的是:物理层训练。包括:DetectPollingRecoveryL0等状态。现场重点演示了:Analyzer 的 Timeline 时间轴。这个时间轴最大的价值:就是:可以直观看到:Link RecoveryLTSSM 跳转RetryRecovery 震荡等行为。现场还提到:如果链路存在:SI 问题Margin 不足Lane 不稳定通常会看到:Timeline时间轴上大量 Recovery 竖线。这一点在 Gen5 环境里特别明显。七、关于低功耗 L1.2:现场讨论非常多今天交流中,另一个大家讨论特别多的话题:就是:L1.2。尤其:M.2 SSD笔记本Client SSD方向。现场有工程师提到:以前某些平台:一进入 L1.2 就大量丢数据。而现场也明确提到:目前很多传统 Analyzer:在:L1.2Low PowerCLKREQ#场景下,仍然会出现:Trace 丢失解码错误状态异常等问题。这一点:其实在做:M.2 NVMe SSDNotebook SSDModern Standby的团队里,现在已经是非常典型的问题。八、为什么“无损复现问题”越来越重要?今天现场还有一个讨论非常有意思。就是:真正好的协议分析仪,不是“让链路更稳定”。而是:“不要改变原始问题”。因为:很多研发调试最怕的是:“不接分析仪有问题, 接了分析仪问题消失。”所以:现在越来越多团队开始重视:Analyzer 本身是否改变链路行为。现场其实反复强调:真正好的 Analyzer:应该:尽量透明。这也是为什么:现在:无 Retimer高保真透传架构越来越被重视。九、关于 Trigger、长时间抓包与 Trace 存储后面现场还讨论了:长时间抓包。因为:Gen5 x16:数据量非常大。现场介绍:Analyzer 内部:FPGA BufferNVMe SSD共同工作。同时:支持:TriggerPacket 截断指定长度存储长时间 Trace等模式。例如:某些场景:不需要保存完整 Packet。只保留:前面 Header 部分。这样:能显著延长抓包时间。十、现场交流的一个整体感受整个两个多小时交流下来,其实有一个非常明显的感受:PCIe 5.0 之后,协议分析已经越来越像“系统级调试”。而不是:“简单抓包”。尤其:Gen5Gen6AI 服务器GPUSSDCXL之后,很多问题:实际上都是:SIRecoveryLTSSMLow PowerRetimerCompatibility共同作用。很多时候:系统:“能跑”,不代表:真正稳定。而协议分析仪:本质上就是:帮工程师看清系统内部到底发生了什么。总结整体来看,今天这次现场交流,对于第一次真正接触 PCIe 5.0 x16 Analyzer 的工程师来说,最大的帮助其实是:建立了一个完整概念。包括:协议分析仪到底是什么为什么需要 Interposer为什么 SI 如此重要为什么 LTSSM 是核心为什么 L1.2 难调为什么高保真越来越关键为什么 Gen5 / Gen6 已经进入系统级调试时代同时,现场 Live Demo 也让大家更直观地看到:一套真正用于 PCIe 5.0 / 6.0 调试的 Analyzer,到底是如何工作的。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND, DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-15 11:13:51
  • 【高清视频】PCIe 5.0 x16 协议分析仪到底怎么用?从硬件安装到 NVMe Trace 分析一次讲透

    最近和用户技术交流的时候,经常碰到一些新加入公司的工程师从来没有使用过计算机总线协议分析仪,例如PCIe协议分析仪,我又翻出来几年前拍摄的PCIe 5.0 x16协议分析仪的高清演示视频,对于其中的主要内容做了提炼,分享给感兴趣了解的朋友。注意:我们的文章来自我们平时自己在实验室做的测试拍摄的高清视频,和国内用户的技术交流,以及和国内、外最前沿厂商和供应商的产品、技术、产品的培训和沟通,不是AI生成,但有些文字会通过AI进行润色,使得阅读更加通顺。SerialTek PCIe Gen5 x16 协议分析仪安装、调试与使用我们今天整理的内容,来自之前做的一套比较完整的 SerialTek PCIe Gen5 x16 协议分析仪培训视频,该视频以分析PCIe 5.0 x16插卡为例进行演示。整个视频比较长,大概2小时40分钟,对于该视频感兴趣的朋友可以留言给我们,这个视频既包含了硬件连接、上电、抓包环境搭建,最关键的包含了管理软件使用、Trace 分析、LTSSM 状态查看、协议解码等内容。因为很多刚接触 PCIe 协议分析仪的工程师,第一次看到这种设备时,都会觉得:设备很贵线很多软件界面复杂不知道从哪里下手不知道抓到的数据到底怎么看所以这篇总结,我们尽量按照视频里的实际演示顺序来整理,同时尽量用工程师日常调试的思路来讲,不去堆太多规范术语,而是尽量让第一次接触 PCIe Gen5 x16 Analyzer 的人,也能大概建立一个完整印象。一、PCIe 协议分析仪到底是干什么的?培训一开始,其实首先强调的并不是“怎么点软件”。而是:为什么需要 PCIe 协议分析仪。很多人第一次接触 PCIe 调试,会下意识觉得:“PCIe 不就是一条高速总线吗?” “设备能识别出来不就行了?”但真正做服务器、GPU、SSD、NIC、CXL 或 AI 系统调试时,很快会发现:很多问题其实根本无法只靠:dmesgWindows Event驱动日志BIOS log定位。例如:LTSSM 为什么卡在 Polling?为什么 Recovery 反复震荡?为什么设备偶尔掉链?为什么 Gen5 x16 会退速?为什么能枚举但性能异常?为什么 Linux 正常、Windows 蓝屏?为什么高压力下突然出现 Replay?为什么训练后偶现 Correctable Error?这些问题,最后都要回到:PCIe 链路本身到底发生了什么。而协议分析仪,本质上就是:在 Root Complex (你理解成CPU)和 Endpoint(你理解成各类PCIe插卡,如网卡,GPU卡) 中间“监听”PCIe 总线。把:Ordered SetDLLPTLPLTSSMSidebandLink State全部抓下来。这也是为什么:现在很多大型服务器、SSD、GPU、CXL 公司,已经把协议分析仪视为:基础研发工具。而不是“出了问题才偶尔借来用”的设备。二、Gen5 x16 分析仪长什么样?培训视频前半部分,首先演示的是:硬件本体。很多工程师第一次看到 Gen5 x16 Analyzer 时,第一反应通常是:“怎么这么大?”因为:PCIe Gen5 x16:已经是:32 GT/s × 16 Lane的数据量。它不是普通逻辑分析仪能处理的。视频里演示的这套设备:主要包括:主分析仪设备Host 控制电脑Gen5 x16 Interposer专用高速线缆外部供电被测系统等。其中:Interposer是整个系统里最关键的东西之一。因为:它负责:在不影响 PCIe 正常工作的情况下,把高速信号“复制”一份给分析仪。这个过程其实非常难。因为:Gen5 已经进入:极高信号完整性要求时代。所以:线缆长度接口质量PCB 设计RetimerREFCLK都会影响是否能稳定抓包。三、硬件连接流程视频里接下来重点演示的是:怎么接线。这一部分其实非常重要。因为:很多第一次使用 PCIe Analyzer 的人,并不是不会点软件,而是:线接错了。整体连接思路其实很简单:1)Host 与 Device 中间插入 Interposer即:CPU/Switch ↔ Interposer ↔ SSD/GPU/NIC2)Interposer 再连接分析仪通过专用高速线:Interposer ↔ Analyzer3)Analyzer 连接控制电脑控制电脑负责:配置TriggerTrace 保存后处理分析培训里特别强调:Gen5 时代一定要注意供电。包括:外部供电是否稳定Interposer 是否需要额外供电某些设备是否必须先上电再启动软件因为:Gen5 x16:已经不像早期 Gen3 那么“随便插都能跑”。四、第一次抓包时最容易遇到的问题培训视频里,其实花了不少时间讲:“为什么抓不到数据”。这部分很真实。因为:很多新人第一次使用时:经常:软件打开了设备识别了但没有 Trace或者:Link 一直不上一抓包就掉链只能跑到 Gen1Lane width 不对这里视频里重点提到几个经验:1)先确认链路本身正常即:不要一上来就怀疑分析仪。先确认:HostDeviceInterposer在不抓包时:本来就能稳定工作。2)Gen5 对线缆非常敏感培训里特别提到:Gen5 后:很多问题其实是 SI 问题。包括:Lane margin插损线材Connector3)某些平台会因为低功耗导致抓包异常尤其:笔记本M.2 SSDClient 平台会频繁进入:L1 / L1.2。这时候:CLKREQ#REFCLKRecovery都会频繁变化。如果分析仪处理不好:就容易:丢 Trace。这一点,在之前 M.2 SSD 的技术交流里也反复提到。五、软件界面初步认识硬件连接完成后,培训开始进入:软件演示。这部分对于第一次接触的人,其实是最容易“懵”的。因为:界面里会出现:LTSSMOrdered SetDLLPTLPLaneSpeedRecoveryTriggerTrace Buffer等大量内容。视频里的讲法比较接地气:不是一上来讲规范,而是:先让大家知道:“哪个界面是干什么的”。整体软件大概分成几个区域:1)Timeline 时间轴这是最核心区域之一。所有抓到的数据:都按时间顺序排列。2)Packet/Event 窗口显示:Ordered SetDLLPTLPNVMe Command等。3)解码窗口点某一包后:会自动展开:HeaderAddressTagLengthCompletion等字段。4)LTSSM 状态区显示:DetectPollingConfigRecoveryL0等链路状态。六、为什么 LTSSM 如此重要?培训里后面花了大量时间:讲 LTSSM。因为:绝大部分 PCIe 问题,最终都会反映在 LTSSM 上。视频里讲得比较通俗:可以把 LTSSM 理解成:PCIe 链路“从陌生到建立连接”的全过程。例如:Detect互相检测有没有设备。Polling双方开始“打招呼”。Config协商 Lane 数量、速度等。Recovery重新训练链路。L0正式进入正常工作状态。培训里一个很重要的经验是:看 LTSSM 的变化顺序。很多问题:不是“不工作”。而是:卡在某个阶段反复循环。例如:Polling ↔ RecoveryRecovery ↔ RecoveryConfig 失败这些都能帮助快速定位问题方向。七、软件里怎么看性能问题培训后半段,开始讲:NVMe / PCIe Trace 分析。这里演示了:QueueRead CommandCompletionLatency等。重点不是:“协议规范怎么定义”。而是:工程师平时怎么看问题。例如:一个 NVMe Read Command:从 Host 发出,到 Completion 返回。中间:实际上包含:很多底层 PCIe TLP。软件里:可以直接:点中一条命令自动关联上下文统计耗时这比以前:人工对时间戳,方便很多。视频里还演示:如何:放大时间轴对比不同 Packet统计最慢命令查看不同 Queue 延迟这些对于:SSD 性能分析GPU DMANIC 流量CXL Memory调试都非常有用。八、为什么现在越来越多工程师开始重视 Trace 分析培训最后其实讲了一个很现实的问题:真正懂 PCIe Trace 的工程师,非常少。因为:很多人:会写驱动会做硬件会做 FPGA但:不一定真正懂 PCIe Trace。而现在:随着:PCIe Gen5PCIe Gen6CXLAI服务器快速发展,越来越多问题:已经不能只靠:猜日志经验解决。最终:还是得回到:Trace。培训里也提到:现在很多公司:其实都在缺:真正懂 PCIe 的工程师。因为:PCIe 已经不只是“一个接口”。而是:现代服务器内部最核心的互连体系。九、这套培训给人的最大感受整个培训看下来,最大的感受其实是:PCIe 协议分析,本质上不是“看包”。而是:看系统行为。尤其到了:Gen5Gen6CXL之后,很多问题:已经不是单纯协议错误。而是:SI电源LTSSMLow PowerRecoveryFirmwareBIOSDriver共同作用。很多时候:系统:“能跑”,不代表:真正稳定。而协议分析仪:就是帮助工程师:把这些“系统内部真实发生的事情”看清楚。十、总结对于第一次接触 PCIe Gen5 x16 Analyzer 的工程师来说,最重要的,其实不是:一开始就把规范背下来。而是:先建立几个概念:1)Analyzer 不是示波器。它更像:PCIe 世界里的“抓包工具”。2)LTSSM 非常重要。很多问题:都能从:PollingRecoveryL0变化中看出来。3)Timeline 是核心。因为:PCIe 本质是:时间序列行为。4)很多问题:本质上是:SILow PowerRecovery问题。而不仅是:“协议不对”。5)真正学 PCIe:一定要:多看 Trace。因为:很多经验:不是规范里写出来的,而是:一条一条 Trace 看出来的。更多PCIe5&6.0, CXL, NVMe SSD, SAS/SATA, NVMe over Fabric (NVMoF), NAND, DDR5/LPDDR5以及UFS测试方面的问题想咨询,可以查看Saniffer公司2026.2.24最新更新的测试工具白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-14 10:17:22
  • 【深度揭秘】为什么最新Windows 11笔记本复制大文件竟不如旧款Windows 10?

    我平时工作用的笔记本是某知名厂家的2018年的型号,商务本,较轻薄,后来也陆续买过同一款后续的笔记本,例如2019款,2020款,因为存在一些经常掉声卡的问题没怎么用(要经常zoom 开会),再后来2024年和2025年又分别买过当时最新的笔记本,严重影响工作,其中2024款两个主要问题无法忍受:1)笔记本不提供指纹识别,但是FaceID经常失效;2)Windows 11查询文件查不到,后来搜索引擎一查,发现全球用户民怨沸腾;2025款也发现不少问题,例如:从C盘A目录拷贝一个大文件到B目录,还不如2018年的ThinkPad快和稳定,当然中间差了几个代际了,区别主要在于:2018款是Core CPU第i7 第8代(4核),16G内存,三星EV 970/980 PCIe 3.0 x4 M.2 SSD 2TB(后续自己更换),运行Windows 10;2025款是Ultra 7 AI CPU(8+4核),32G内存,Seagate PCIe 4.0 x4 M.2 SSD 2TB(京东授权代理更换),运行Windows 11。我对这个事情也觉得好奇,2026年我还得不得不使用8年前的笔记本电脑工作。所以,今天,我结合网上找到的各类和我碰到类似问题的反馈来,以及Windows版本对于文件系统的处理差异,SSD采用工具的实测性能、笔记本电脑的SSD的PCIe链路的L1.2低功耗等多个方面来简单分析一下为什么会出现这种奇怪的现象。同时,我们也会结合Saniffer的很多针对PCIe M.2 SSD的诊断、分析、故障定位等各类工具看看可以协助分析这些性能问题。首先,网上查到的很多测试都显示,和我上述的感受差不多,即便是配备高端硬件的Windows 11笔记本,在大文件复制任务中也可能整体表现不如老款Windows 10机。主要原因包括文件系统和驱动差异、SSD缓存和低功耗管理、散热限制等多重因素。例如,一项测试中Windows 11系统复制6.7GB文件时,初始速度虽达3–4 GB/s,但很快跌至约150 MB/s并持续低速;而合成基准测试却持续给出7.4/6.8 GB/s的读写值,表明OS缓存和驱动策略导致实际复制速度大打折扣。我们结合网上找到的的2023–2026年相关测试报告,以及自己实际使用的感受,对比分析Windows 10/11文件复制测试的硬件配置、系统版本、驱动、电源策略、文件系统设置和测试方法,给出完整案例和数据;并通过PCIe 4.0 SSD产品对比表和专用诊断工具(SerialTek、Quarch等)的使用流程,深入剖析大文件复制性能瓶颈及解决方案,最后提供实用建议和测试指南。Windows 11 vs Windows 10 文件复制性能对比现有测试表明,在相同硬件条件下,Windows 11并未必优于Windows 10。例如Tom’s Hardware一项使用相同老旧硬件(ThinkPad X220 i5+HDD)的测试发现,Win11在绝大多数项目中最慢,仅在“文件传输”这一项排名第二,仅次于Win10。这说明Win10在文件复制上略占优势。微软内部测试偏向高端配置,但用户实际对比也发现Win11对随机/小文件写入有明显拖慢:微软技术社区和十一(Eleven)论坛用户反馈,某Win11系统复制大文件时CPU飙高却速率骤降;而相同平台在Win10下并无此问题。微软支持论坛和用户报告均指出,“Windows 11中出现这种随机写入速度下降问题,而同机型的Windows 10没有”。这表明Win11对NVMe设备或文件系统的管理更保守或复杂。另一方面,Win11 24H2在ReFS文件系统引入了“Block Cloning”特性:官方称在ReFS卷上复制大文件可提速18%–94%。这表明文件系统本身优化潜力巨大,但常见笔记本多用NTFS或FAT格式。文件复制测试示例以复制单个大文件为例,假设源文件路径为 C:\TestData\bigfile.dat(10 GB),目的地为 D:\Backup\bigfile.dat,使用Windows资源管理器(或 robocopy)执行拷贝。对于最新的Windows 11旗舰机(Intel Ultra 7 + 32GB + PCIe 4.0 NVMe),实测中前几秒速度可达3–4 GB/s(利用SSD SLC缓存),但随着写入继续,“速度骤降到仅约150–500 MB/s”并稳定在该水平。此时CPU占用率往往不低(部分线程满载),因为操作系统需要频繁刷新缓存与写元数据。原因在于现代SSD使用伪SLC缓存来加速写入,一旦SLC缓存写满,就会出现“悬崖式”掉速:如分析所示,速度常从GB/s级别骤降到几百MB/s。相比之下,同样任务在7年前的Win10笔记本(2018年i7 + 16GB + PCIe 3.0 NVMe)上,虽然写入速度相对比读取速度要慢,但稳定写入速率可能能持续在800MB/s–1GB/s左右,且CPU占用可能更低一些,因为该平台对并发缓存机制略简单。举例数据:一个实际案例中,Win11机完整复制6.7GB文件耗时约7秒后速率骤降到最终极慢,而某旧款Win10机同样拷贝可能保持在1GB/s,耗时长但更平稳。对于小文件拷贝(如1万+个1 MB文件),资源管理器会为每个文件逐一操作(分配空间、写入数据、更新MFT和日志、计算进度等),开销巨大,整体吞吐往往只有数十MB/s,且CPU几乎100%忙于处理目录和安全扫描。同时,不同驱动影响也不可忽视:例如使用Intel RST驱动的模式在Win10下可能与Windows内置NVMe驱动(Win11推荐方案)性能略有差异;SSD厂商白皮书通常给出不同驱动下的性能测试数据。测试方法建议列出:单线程拷贝(Explorer或 robocopy/MT:1),记录总耗时和平均速度;对比多线程并发拷贝任务;拷贝前后使用 fsutil behavior queryDisableDeleteNotify 确保TRIM已启用;关闭Defender或实时扫描以免干扰(可观察见);在固定电源计划下(详见下文)进行测试。如源文件与目标卷都支持NTFS/ExFAT,则按需分别测试单大文件和许多小文件情况,记录吞吐和延迟(可用资源监视器或 perfmon 计量)。文件复制 vs 合成基准测试合成基准工具(如CrystalDiskMark、ATTO、AS SSD等)测量的主要是SSD在理想条件下的峰值性能,而非文件复制中的真实表现。例如,CrystalDiskMark默认使用单方向、大块(1MiB)、高队列深度(QD=8)*测试:它只读或只写,不涉及NTFS元数据更新;其 SEQ1M Q8T1 测试往往完全跑在SSD的SLC缓存内,因此可以轻易达到官方标称速度(几GB/s)。但Windows资源管理器的复制操作是*读写并行的(源读+目标写),并且单线程(QD=1)、固定小缓冲区,还要不断更新文件系统索引、NTFS日志及计算进度。这意味着实际文件复制的速率往往远低于CDM或ATTO的高分值。例如Brent Ozar说明:CDM的“SEQ1M Q8T1”意味着8个并行队列请求,能够充分填满NVMe队列;而实际文件复制更类似于“SEQ1M Q1T1”。AS SSD通常使用QD=1顺序读写,也更贴近单流表现;ATTO则只测序列读写(一般QD=1)。但这些工具仍然缺乏文件系统开销和缓存耗尽后的表现。综上所述,真实用户体验反映在实际文件拷贝中更接近于低队列、持续写入下的表现,如果结果远低于合成测试要属正常。建议测试流程:使用 robocopy或专门工具(如DiskBench)实际拷贝大文件并测量速度,同时使用CrystalDiskMark的低队列单线程(SEQ1M Q1T1)和AS SSD Seq测试对比,观察SLC缓存耗尽前后的速率,以此了解SSD的持续性能和OS开销。ATTO和CDM可用于验证硬件“最大理论值”,但评测拷贝问题时更应关注单线程、实际文件测试结果。PCIe 4.0 SSD 对比表即使都是PCIe 4.0接口,主控厂商、NAND类型和DRAM缓存的不同会导致性能差异巨大。下表列出几款具有代表性的PCIe 4.0 M.2 SSD,以及其控制器、NAND工艺、DRAM配置和性能指标(部分数据来自官方及评测):说明:以上读写和IOPS数据多为厂商标称峰值或评测Peak值;实际持续写入速度通常低于峰值,受SSD容量、热节流和SLC缓存大小等影响。如Corsair MP600 LPX在2TB下标称顺写6800MB/s,但大量测试发现SLC缓存满后可降至几百MB/s。此外表中未列出的控制器(如Phison E18、Silicon Motion SMI等)和新型164层、232层NAND也存在类似差异,选择SSD时务必参考最新评测。专业诊断工具与故障定位流程对于笔记本M.2 SSD问题,有条件的话可以使用Saniffer推荐的一些工具进行深入分析:SerialTek PCIe分析仪(Kodiak系列):可捕获主机与SSD之间的完整PCIe信号和NVMe协议交互,并与Quarch PAM结合记录每条电源线的实时电流和功耗。例如它能同时看到PCIe数据信号和侧带信号(如PERST#、WAKE#等)。Quarch PAM (Power Analysis Module):插入SSD电源轨(或用适配卡),以每4μs对电压/电流精确采样,记录功耗曲线。可捕捉电源上升沿、栅极扫描、侧带信号变化等。通过PAM,能看到SSD进入深度睡眠(L1.2)时功耗骤降,以及唤醒时功耗尖峰。Quarch Breaker (信号破坏器):可快速断开/接通SSD供电或PCIe信号,用于模拟插拔、复位或错误注入。例如可以人为触发SSD复位序列,观察系统反应。Quarch PPM (Power Profile Module):自带可调稳压电源,对被测SSD供电并可精确调整电压和瞬时丢失电源时间。适用于电压裕量测试(Margining)和模拟突然掉电等场景。下图以流程图形式展示一个诊断“复制慢”问题的思路:此流程首先根据表现区分热节流与电源管理问题,然后利用SerialTek+Quarch PAM判断PCIe链路和功耗变化(如L1.2唤醒时的延迟和功率峰值)。如确认为L1.2问题,可按建议关闭NVMe ASPM;如为热力学问题,则需改善散热。对疑难信号问题还可用Quarch Breaker注入信号干扰或复位脉冲,用PPM测试SSD对电压变化的敏感度。以上工具均来自NVMe/PCIe测试行业,能检测信号完整性、协议错误和电源异常。例如如果抓包发现NVMe命令重传或死锁,就可能是固件BUG或驱动兼容问题,此时尝试更新固件或回退驱动;如果PAM记录到未预期的功耗抖动,则可能是主板供电不足或电压调节器问题。常见问题与诊断工具对应典型的PCIe M.2 SSD故障和对策包括:热节流(Thermal Throttling):SSD温度过高时写速下降。iFixit测试表明,在某MacBook Pro上SSD温度超过68°C时,90秒后写入速率下滑44%。解决方法是改善散热(加散热片、保持良好空气流通)。问题检测可通过HWinfo监控SSD温度或通过持续写入观察性能曲线。PCIe L1.2低功耗唤醒延迟:Windows默认开启NVMe ASPM L1.2,会在闲置后首次I/O引入8–12ms延迟。症状是每次复制中途停顿,然后加速恢复。使用SerialTek+PAM可观测到链路进入L1.2和功耗降低,而唤醒时出现功率峰值。此问题可通过“高性能”电源计划或在高级设置中关闭PCIe链路省电来避免。固件或驱动BUG:有时SSD控制器固件会出现内部错误(如缓冲区溢出、指令挂起等)。可用SerialTek捕获NVMe命令流并检查错误码或重传情况。如果怀疑此类问题,可用Quarch Breaker插入错误以复现场景。解决方案是更新固件和驱动程序,厂商常发布修复固件。BIOS/主板设置错误:如PCIe通道限制、NVMe模式(AHCI/VMD)错误等,可导致性能下降。使用SerialTek分析可验证链路协商速率和通道数(例如检查是否真正以PCIe 4.0 x4运行)。如发现主板强制在Gen3或共享带宽(某些笔记本将M.2与显卡/雷电共享),需在BIOS设置中调整或换用PCIe 4.0通道。供电不足/干扰:移动设备节能会在SSD上施加低压或掉电以省电,此时使用Quarch PPM模拟电压突降或闪断可检验SSD反应。SerialTek/PAM可监测到主板电压调节器输出异常时SSD功耗波动。问题可通过BIOS关闭低压模式或在关键时刻提升供电裕量来解决。共享通道/命名空间问题:笔记本上M.2通道有时与其他设备共享(如带宽给Wi-Fi/Thunderbolt),或者存在多命名空间配置(企业级)。这些问题通常通过软件确认:例如检查Windows设备管理器的命名空间列表,或用硬件信息软件查看总线拓扑。L1.2 低功耗状态问题详解PCIe L1.2是一种链路低功耗状态,当NVMe设备闲置一定时间后进入。由于链路深度睡眠,每次恢复通信需要“唤醒”过程,这会造成高延迟:如上所述,Windows 平衡电源计划默认开启L1.2,使第一次I/O延迟增加8–12ms。症状表现为每次复制停顿(特别是在文件复制间隔出现的阵发性停顿)和第一个IO延时。重现方法:在执行复制过程中故意等待数百毫秒,再观测后续写入延迟;或用十字网卡并行测试。可用SerialTek检查PCIe信号:如果长时间无数据后链路进入L1.2,可在链路状态指示和Quarch PAM记录中观察到电压下降。要确认此问题,可对比在“平衡”与“高性能”计划下的复制速度,通常高性能计划(禁用L1.2)可以显著减少停顿。Windows上,解决方案包括在高级电源选项中找到“PCI Express – 链路状态电源管理”将其设为“关”,或修改注册表/组策略禁用NVMe节能(见《技评》)。在Linux系统,则通过修改 /etc/modprobe.d 禁用 NVMe 省电策略。测量工具:可以使用 perfmon 或 Windows API 观察 NVMe 寄存器功耗状态(如 NVMe Capabilities 的 PS Max Latency),或用SerialTek+PAM抓取低功耗进入时的功率下降及唤醒上的功率尖峰,以验证链路进入/退出L1.2的时序。实用建议对比测试:在自己的笔记本上,先关闭杀毒及Windows索引,确保TRIM已启用,然后在“高性能”电源计划下,用 robocopy/J(无缓冲)或 dd式工具拷贝一个大文件(如10–20 GB),记录平均速度和CPU占用。再运行CrystalDiskMark的SEQ1M Q8T1和SEQ1M Q1T1测试,以及AS SSD顺序读写测试,对比理想和实际值。建议也用并发小文件复制(例如脚本创建大量1MB文件)测试小文件场景。BIOS/硬件设置:确认BIOS已启用PCIe 4.0 x4模式(用 hwinfo64检查NVMe控制器所连接的PCIe版本)。如果存在NVMe共享或节能选项,可尝试调整或禁用。为SSD增加散热(贴金属散热片或购买带散热片版本),避免长时间满载时热降速。更新驱动与固件:确保使用Intel RST或主板推荐的存储驱动;SSD固件应更新至最新版本(许多厂商SSD管理软件如Samsung Magician、Crucial SE可自动化升级)。最新Win11版本也会修复部分NVMe驱动问题。测试工具推荐:除了合成基准(CrystalDiskMark、AS SSD、ATTO)外,还可使用PCMark 10的Storage压力测试或Samsung/Intel自带的大文件复制测试脚本。另外,PowerShell的 PerformanceCounter 或系统监视器可记录文件复制过程的延迟和CPU负载。对于开发者,可尝试DiskBench等专用软件,更贴近日常文件操作场景。电源策略设置:如果遇到明显的间歇性停顿问题,应在控制面板高级电源选项中将“PCI Express/链路状态管理”设为“关闭”;并使用“高性能”计划测试。此外,可在注册表或电源cfg中关闭NVMe驱动的APST功能,以减少延迟。防病毒设置:对于复制大量文件的测试,应暂时关闭实时防护或将目标目录排除在扫描之外,以排除安全扫描带来的额外开销。通过以上分析和测试,可以帮助用户和评测人员定位Windows文件复制性能瓶颈,并采取针对性的优化措施。最后建议:仅参考合成成绩容易导致误判,应以实际场景测试为准;同时密切关注系统更新和SSD厂商的技术公告,以获取最新的性能修复和优化提示。更多关于PCIe 5.0/6.0,CXL, SSD等的测试工具和技术,可以查看Saniffer公司2026.2.24最新更新的白皮书15.1版本,我们已经整理收录在Saniffer公众号的【白皮书】菜单中。欢迎关注Saniffe公众号,点击底部菜单栏即可免费获取。如有任何技术问题,也可直接在公众号内留言交流。
    2026-05-13 10:15:07
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 39
    • 电话:(021)5080-7071; 131-2785-6862

      在这里输入描述
    • www.saniffer.cn

      在这里输入描述
    • 邮箱:sales@saniffer.com

      在这里输入描述
    • 地址:上海市浦东新区张江路505号1号楼1605-1单元

      在这里输入描述

    关注微信公众号

    上海森弗信息技术有限公司 备案号:沪ICP备2024076352号-1

    版权所有 © 上海森弗信息技术有限公司 技术支持:竹子建站