中科存储 WS5000 × NVIDIA Dynamo / KVBM / NIXL / GPUDirect Storage —— 同一范式,不同层次:客观对比、互补定位,数据可查证。
先看共识瓶颈,再看双方技术,最后看客观对比与互补定位
| 模块 | 要点 | |
|---|---|---|
| 01 | 瓶颈共识 | GPU 被慢 IO「饿着」——这是 NVIDIA 与我们的共同判断 |
| 02 | 中科存储 技术栈 | 存算分离 + 四大核心技术 |
| 03 | 逐项对标 NVIDIA | 存算分离 / KV Cache 卸载 / GPUDirect / 数据通路 |
| 04 | 客观对比总表 | 维度逐行,标注口径与官方出处 |
| 05 | 生态互补与实测 | 第三方实测 + 国产可控定位 |
这与中科存储的判断一致:大模型时代真正的瓶颈在数据供给侧——模型加载、Checkpoint 读写、KV Cache 调度,而非单纯堆叠算力。
以存算分离为核心,把存储从「配角」升级为「算力放大器」。
NVIDIA 以软件 / IO 框架定义了「分离式推理 + KV Cache 分层卸载 + 存储直通」范式;中科存储在存储底座层把同样的工程思想落到国产算力上。
NVIDIA Dynamo 官方将其归纳为三项核心技术:分离式服务(Disaggregated Serving)、KV Cache 感知路由、KV Cache 卸载,并由低时延数据传输层 NIXL 支撑。
| 维度 | 中科存储 WS5000 | NVIDIA 对应能力(官方) |
|---|---|---|
| 定位层次 | 全闪存储一体机(硬件底座) | 推理编排 / IO 软件框架(Dynamo·NIXL·GDS) |
| 存算分离 | 硬件 EBOF + NVMe-oF/RoCE | Dynamo 分离式服务(prefill/decode 分离) |
| KV Cache 卸载 | KV-Cache 分层调度(显存↔全闪) | KVBM 分层 G1→G4(GPU→CPU→SSD→远端) |
| GPU 直通路径 | GPUDirect 直通 + NVMe-oF | GPUDirect Storage(GPU↔NVMe/NVMe-oF DMA) |
| 主力算力适配 | 国产 GPU / 昇腾 90%+(S9) | 以 NVIDIA GPU 生态为主 |
| 数据不出域 / 信创 | 强(自主可控) | 视部署与合规评估 |
| 第三方实测 | 有(北京信息科技大学·昇腾910B,S38) | 以官方 / 合作方资料为准 |
| 关系 | 互补:可作该范式的国产存储底座 | 开放接入第三方存储(WEKA / Dell 等) |
NVIDIA 的 KVBM / NIXL 开放接入第三方存储。其官方动态显示:「Dell 将 PowerScale 与 Dynamo 的 NIXL 集成,TTFT 提速 19×」「WEKA 与 NVIDIA 合作为 Dynamo 提供 KV Cache 存储」。
用可复现的第三方实测说话,给出诚实的定位。
| 模型 | 中科存储 加载 | NFS 加载 | 加载提速 | 服务整体提速 |
|---|---|---|---|---|
| DeepSeek-32B | 6.62 s | 563.85 s | 85.2× | 6.17× |
| DeepSeek-70B | 35.38 s | 1284.66 s | 36.3× | 9.33× |
最后更新:2026-06-28 · 中科存储数值取自 business_plan/outputs/results.json(S 编号见官网「数据来源与口径」);NVIDIA 描述与链接均为其官方公开资料。
中科存储 WS5000 · 存算分离全闪加速存储算力一体机 · 深圳市中科航星科技有限公司