【高清视频】Nvidia DGX Spark桌面级超级计算机可以做这些!
2025-10-22 13:40:14
Saniffer公司购买的Nvidia DGX Spark可能是国内第一台交付的机器,将于今天上午到达我们办公室。如果有时间的话,我们计划后面做个开箱视频。可能还有些朋友不知道Nvidia DGX Spark究竟是个啥东西,下面我们先借用上周国外刚拿到设备的Anything LLM 创始人拍摄的一个高清视频让大家认识该Spark以及了解它可以帮助我们做什么。

为了方便国内工程师观看,我们花费了一天时间处理本期视频并处理添加了中、英文字幕供大家参考。我们后续计划看如何使用该Spark系统加速我们提取字幕文件,添加字幕的流程。如果想看高清视频建议要在电脑上打开上面的视频链接进行观看!欢迎分享到朋友圈或者与朋友讨论!

以下是基于视频《I got a desktop supercomputer | NVIDIA DGX Spark overview》的一个总结,全面概述了视频中对 NVIDIA DGX Spark 的评测、技术分析与应用展示。

🧩 NVIDIA DGX Spark 桌面级超级计算机综述

一、视频概述

视频由 Anything LLM 创始人 Tim Carambat 拍摄,展示他在获得 DGX Spark 使用权后一周半的深度体验。不同于一般AI评测视频,本片融合了硬件开箱、系统实测、模型运行与微调(fine-tuning)全过程,旨在说明 DGX Spark 如何成为 AI 创作者与开发者的“桌面级算力节点”。


二、产品定位与设计理念

1. 设计初衷

DGX Spark 是 NVIDIA 面向个人开发者推出的 轻量级 AI 工作站,源自 CES 上的 “Project Digits”。它并非替代 Mac Mini 或消费级 PC,而是 为家庭实验室(Home Lab)与 AI 开发者提供补充计算力的节点设备

2. 外观与结构设计

  • 尺寸:150 × 150 × 50 mm(约 6×6×2 英寸)

  • 重量:约 1.2 kg(≈ 2.5 磅)

  • 材质:采用开孔金属泡沫(可能为铝)作为进/排气口,兼具散热与美感。

  • 配色:金色外壳,作者联想到童年 Game Boy Color 与《塞尔达传说:时之笛》卡带。

  • 接口

    • USB-C × 3(含电源口)

    • HDMI × 1

    • Ethernet × 1

    • Wi-Fi / Bluetooth 支持

    • 专用堆叠接口,可实现多机串联以倍增算力。

  • 唯一不足:无电源指示灯,需通过风口气流判断设备是否运行


三、核心硬件规格

下面是Spark机器的一些主要参数:
组件 参数与说明
主芯片 NVIDIA GB10 Grace Blackwell Superchip
架构 统一内存架构(Unified Memory Architecture)
内存 128 GB LPDDR5X,其中 96 GB 可分配为 VRAM
存储 4 TB SSD
CPU 20 核 ARM 架构
内存带宽 273 GB/s
AI算力 ≈ 1 PFLOP (FP4 精度)
功耗 极低(ARM 设计,功耗统计显示远低于 x86 系统)

四、系统与软件生态

1. 操作系统

  • DGX OS 基于 Ubuntu 24 LTS,兼具 Linux 灵活性与 Mac 用户的易用体验。

  • 预装大量 AI 开发相关组件:

    • NVIDIA Container Toolkit、NVIDIA SMI、NVCC 编译器

    • CUDA 13.0 环境

    • Vtop 监控工具

    • DGX Dashboard 与 AI Workbench (支持 Jupyter Notebook 与 模型训练)

  • 免去手动配置 CUDA 与驱动的繁琐过程,开箱即可运行

2. 两种运行模式

  1. 桌面模式:连接 HDMI 与 外设,直接作为 Ubuntu 工作站使用;

  2. 网络模式:作为 AI 专用节点,通过局域网提供推理/微调计算力,实现 “集中式 AI 推理服务”。


五、实际应用演示

1. 模型推理性能

  • 在 Ollama 环境下运行 GPT-OSS 120B 模型,推理速度稳定在 ≈ 30 tokens/s

  • 支持多任务、流式输出,性能稳定。

2. 与 Anything LLM 集成

  • 可本地运行 Anything LLM,执行 CSV 与 PDF 数据分析、图表生成、工作流自动化;

  • 演示示例:导入包含 Robert De Niro 电影评分的 CSV 文件,模型自动提取数据、进行统计分析、生成结论。

3. 模型微调(Fine-Tuning)

  • 在 Jupyter Notebook 中使用 Unsloth 开源框架 执行 Gemma-3-4B 模型的微调;

  • 示例数据集为 IT 支持工单(约 500 条样本),用于生成问题-解决方案匹配模型;

  • 展示了从数据导入、模型加载、训练到 GGUF 格式导出的一站式流程,仅需一行代码即可完成导出

  • 说明 DGX Spark 可高效处理 数百 MB 级别的数据微调任务,同时兼顾能耗与速度。


六、性能与应用场景分析

下面是针对一些常用应用场景,Spark和传统设备的对比。
场景 DGX Spark 优势 对比传统设备
个人开发者 / AI 爱好者 一体化 AI 环境、轻量级 部署 免除复杂 CUDA 配置
家庭实验室(Home Lab) 可堆叠扩展、支持 局域网推理 替代多 Mac mini 集群
中小企业 AI 应用测试 支持 Fine-tuning 与 Inference 双模式 功耗更低、成本可控
教育与研究场景 Jupyter + Workbench 环境即开即用 教学示范友好

作者特别指出:DGX Spark 不是桌面 PC 替代品,而是 AI 计算力的延伸节点,可与现有 GPU 主机协同工作,共享任务负载I got a desktop supercomputer  …。


七、总体评价与结论

  • 优点 

    ✅ 极低功耗、高性能 ARM 架构 

    ✅ 出厂即装配完善 AI 软件栈 

    ✅ 支持堆叠扩展、统一内存设计 

    ✅ 适合 AI 开发、教学、家庭实验室

  • 不足 

    ⚠️ 缺少电源指示灯及前端状态显示

    ⚠️ USB-C 外设兼容性需适配器 

    ⚠️ 尚属早期 Access 版本,驱动与性能仍有优化空间

总结

NVIDIA DGX Spark 在桌面级 AI 计算领域定义了全新形态——它结合了服务器级 算力、个人桌面机的便携性以及完善的 AI 生态系统支持。对于希望在本地完成模型推理、微调或教学实验的用户而言,它提供了一种 低门槛、高性能、低功耗 的理想方案。

更多关于PCIe 6.0/CXL的测试工具和技术,特别是对于Chapter 17 ”附录H:AI大模型训练/推理基础原理和底层硬件兼容性、稳定性诊断、分析和测试介绍感兴趣的,请下载Saniffer公司2025.6.16最新更新的白皮书12.3版本 - 《PCIe5&6.0, CXL, NVMeNVMoF, SSD, NAND, DDR5, 800GE测试技术和工具白皮书_ver12.3》。
白皮书下载链接 (或者点击下面的二维码直接下载):

https://pan.baidu.com/s/18_c11aeFhSBe2qa-jUFs_Q?pwd=mm9y 提取码: mm9y

图片

如果你有其任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的我问题想咨询,请访问:访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品;或者添加点击左下角“阅读原文”留言,或者saniffer公众号留言,致电021-50807071 / 13127856862,sales@saniffer.com。

图片