【高清视频】Nvidia DGX Spark桌面级超级计算机可以做这些！

2025-10-22 13:40:14

Saniffer公司购买的Nvidia DGX Spark可能是国内第一台交付的机器，将于今天上午到达我们办公室。如果有时间的话，我们计划后面做个开箱视频。可能还有些朋友不知道Nvidia DGX Spark究竟是个啥东西，下面我们先借用上周国外刚拿到设备的Anything LLM 创始人拍摄的一个高清视频让大家认识该Spark以及了解它可以帮助我们做什么。

为了方便国内工程师观看，我们花费了一天时间处理本期视频并处理添加了中、英文字幕供大家参考。我们后续计划看如何使用该Spark系统加速我们提取字幕文件，添加字幕的流程。如果想看高清视频建议要在电脑上打开上面的视频链接进行观看！欢迎分享到朋友圈或者与朋友讨论！

以下是基于视频《I got a desktop supercomputer | NVIDIA DGX Spark overview》的一个总结，全面概述了视频中对 NVIDIA DGX Spark 的评测、技术分析与应用展示。

🧩 NVIDIA DGX Spark 桌面级超级计算机综述

一、视频概述

视频由 Anything LLM 创始人 Tim Carambat 拍摄，展示他在获得 DGX Spark 使用权后一周半的深度体验。不同于一般AI评测视频，本片融合了硬件开箱、系统实测、模型运行与微调（fine-tuning）全过程，旨在说明 DGX Spark 如何成为 AI 创作者与开发者的“桌面级算力节点”。

二、产品定位与设计理念

1. 设计初衷

DGX Spark 是 NVIDIA 面向个人开发者推出的 轻量级 AI 工作站，源自 CES 上的 “Project Digits”。它并非替代 Mac Mini 或消费级 PC，而是 为家庭实验室（Home Lab）与 AI 开发者提供补充计算力的节点设备。

2. 外观与结构设计

尺寸：150 × 150 × 50 mm（约 6×6×2 英寸）
重量：约 1.2 kg（≈ 2.5 磅）
材质：采用开孔金属泡沫（可能为铝）作为进/排气口，兼具散热与美感。
配色：金色外壳，作者联想到童年 Game Boy Color 与《塞尔达传说：时之笛》卡带。
接口：

USB-C × 3（含电源口）
HDMI × 1
Ethernet × 1
Wi-Fi / Bluetooth 支持
专用堆叠接口，可实现多机串联以倍增算力。

唯一不足：无电源指示灯，需通过风口气流判断设备是否运行

三、核心硬件规格

下面是Spark机器的一些主要参数：

组件	参数与说明
主芯片	NVIDIA GB10 Grace Blackwell Superchip
架构	统一内存架构（Unified Memory Architecture）
内存	128 GB LPDDR5X，其中 96 GB 可分配为 VRAM
存储	4 TB SSD
CPU	20 核 ARM 架构
内存带宽	273 GB/s
AI算力	≈ 1 PFLOP (FP4 精度)
功耗	极低（ARM 设计，功耗统计显示远低于 x86 系统）

四、系统与软件生态

1. 操作系统

DGX OS 基于 Ubuntu 24 LTS，兼具 Linux 灵活性与 Mac 用户的易用体验。
预装大量 AI 开发相关组件：

NVIDIA Container Toolkit、NVIDIA SMI、NVCC 编译器
CUDA 13.0 环境
Vtop 监控工具
DGX Dashboard 与 AI Workbench （支持 Jupyter Notebook 与模型训练）

免去手动配置 CUDA 与驱动的繁琐过程，开箱即可运行

2. 两种运行模式

桌面模式：连接 HDMI 与外设，直接作为 Ubuntu 工作站使用；
网络模式：作为 AI 专用节点，通过局域网提供推理/微调计算力，实现 “集中式 AI 推理服务”。

五、实际应用演示

1. 模型推理性能

在 Ollama 环境下运行 GPT-OSS 120B 模型，推理速度稳定在 ≈ 30 tokens/s；
支持多任务、流式输出，性能稳定。

2. 与 Anything LLM 集成

可本地运行 Anything LLM，执行 CSV 与 PDF 数据分析、图表生成、工作流自动化；
演示示例：导入包含 Robert De Niro 电影评分的 CSV 文件，模型自动提取数据、进行统计分析、生成结论。

3. 模型微调（Fine-Tuning）

在 Jupyter Notebook 中使用 Unsloth 开源框架 执行 Gemma-3-4B 模型的微调；
示例数据集为 IT 支持工单（约 500 条样本），用于生成问题-解决方案匹配模型；
展示了从数据导入、模型加载、训练到 GGUF 格式导出的一站式流程，仅需一行代码即可完成导出；
说明 DGX Spark 可高效处理数百 MB 级别的数据微调任务，同时兼顾能耗与速度。

六、性能与应用场景分析

下面是针对一些常用应用场景，Spark和传统设备的对比。

场景	DGX Spark 优势	对比传统设备
个人开发者 / AI 爱好者	一体化 AI 环境、轻量级部署	免除复杂 CUDA 配置
家庭实验室（Home Lab）	可堆叠扩展、支持局域网推理	替代多 Mac mini 集群
中小企业 AI 应用测试	支持 Fine-tuning 与 Inference 双模式	功耗更低、成本可控
教育与研究场景	Jupyter + Workbench 环境即开即用	教学示范友好

作者特别指出：DGX Spark 不是桌面 PC 替代品，而是 AI 计算力的延伸节点，可与现有 GPU 主机协同工作，共享任务负载I got a desktop supercomputer …。

七、总体评价与结论

优点

✅ 极低功耗、高性能 ARM 架构

✅ 出厂即装配完善 AI 软件栈

✅ 支持堆叠扩展、统一内存设计

✅ 适合 AI 开发、教学、家庭实验室
不足

⚠️ 缺少电源指示灯及前端状态显示

⚠️ USB-C 外设兼容性需适配器

⚠️ 尚属早期 Access 版本，驱动与性能仍有优化空间

总结

NVIDIA DGX Spark 在桌面级 AI 计算领域定义了全新形态——它结合了服务器级算力、个人桌面机的便携性以及完善的 AI 生态系统支持。对于希望在本地完成模型推理、微调或教学实验的用户而言，它提供了一种 低门槛、高性能、低功耗 的理想方案。

更多关于PCIe 6.0/CXL的测试工具和技术，特别是对于Chapter 17 ”附录H：AI大模型训练/推理基础原理和底层硬件兼容性、稳定性诊断、分析和测试介绍“感兴趣的，请下载Saniffer公司2025.6.16最新更新的白皮书12.3版本 - 《PCIe5&6.0, CXL, NVMeNVMoF, SSD, NAND, DDR5, 800GE测试技术和工具白皮书_ver12.3》。

白皮书下载链接 (或者点击下面的二维码直接下载）：

https://pan.baidu.com/s/18_c11aeFhSBe2qa-jUFs_Q?pwd=mm9y 提取码: mm9y

如果你有其任何关于PCIe5&6.0, CXL, NVMe/NVMoF, NAND, DDR5/LPDDR5以及UFS测试方面的我问题想咨询，请访问：访问www.saniffer.cn / www.saniffer.com 访问我们的相关测试工具和产品；或者添加点击左下角“阅读原文”留言，或者saniffer公众号留言，致电021-50807071 / 13127856862，sales@saniffer.com。