vLLM TP=2 跨节点部署实践:两台 DGX Spark 跑 Qwen3.5-35B-A3B 2026-04-12 #AI #LLM #NVIDIA #DGX Spark #vLLM #Tensor Parallel 记录首次在两台 DGX Spark 上以 vLLM TP=2 方式部署 Qwen3.5-35B-A3B 的过程与 benchmark 结果。 [Read more]