Contract First 落地实践：工具栈、团队协作与我踩到的坑

2026-05-06

#openapi #contract-first #api-first #api-design #api-governance #ai #collaboration

围绕 OpenAPI 的 Contract First 实践笔记：工具栈如何拼、AI 怎么起草 spec、团队同步机制、breaking change 治理、常见坑的对策，以及老项目的迁移路径。

[Read more]

同时用 Claude Code、Copilot、Qwen、Codex，个人 skill 该怎么组织？

2026-04-22

#ai #skills #claude-code #github-copilot #qwen-code #codex

一篇问题驱动的笔记：从多 agent 工作流为什么会变乱开始，拆开 always-on 规则和 skill 的边界、Claude Code 的 skill 加载时机、跨 agent 共享源文件的取舍，以及每家 agent 的落地方式。

[Read more]

vLLM 启用 Qwen3.6 的 preserve_thinking：双机 A/B 验证

2026-04-20

#AI #LLM #vLLM #Qwen #DGX Spark #Reasoning #Chat Template

Qwen3.6 随 KV cache 修复一起引入的 preserve_thinking 开关是 chat template 的 kwarg，不是 vLLM CLI 标志；借助集群两台 DGX Spark 做 A/B 对照，量化出 prompt/completion token 的差异。

[Read more]

Apple M5 上 omlx + Gemma4-26B 性能调优实录

2026-04-19

#AI #LLM #MLX #omlx #Apple Silicon #M5 #Gemma #Benchmark

基于一次 M5 本地测试，记录 MoE 模型带宽瓶颈，以及通过内存热缓存把长上下文推理提速到约 6.4 倍的过程。

[Read more]

两台 DGX Spark 跑 Qwen3.6-35B-A3B：直连 vLLM vs 经过 Gateway 的吞吐对比

2026-04-17

#AI #LLM #NVIDIA #DGX Spark #vLLM #Benchmark #Gateway #Qwen

实测两台 DGX Spark 上 Qwen3.6-35B-A3B-FP8 的 vLLM 吞吐：单机单流 ~50 tok/s，双机经 FastAPI Gateway 并发 N=16 聚合可达 ~485 tok/s。

[Read more]

Bifrost 负载均衡 DGX Spark：从 TP=2 跨节点到双机独立部署

2026-04-14

#AI #LLM #NVIDIA #DGX Spark #vLLM #Bifrost #负载均衡 #Benchmark

将两台 DGX Spark 从不稳定的 vLLM TP=2 跨节点部署迁移到单节点独立运行 + Bifrost 负载均衡网关的完整实践和 benchmark 结果。

[Read more]

Nemotron EP2 vs TP2：两台 DGX Spark 的实际对比

2026-04-14

#AI #LLM #NVIDIA #DGX Spark #vLLM #Expert Parallel #Benchmark

在两台 DGX Spark 上对比 vLLM EP2 和 TP2 跑 NVIDIA Nemotron 3 Super 120B A12B NVFP4 的结果，并分析 EP2 失稳的可能原因。

[Read more]

vLLM TP=2 跨节点部署实践：两台 DGX Spark 跑 Qwen3.5-35B-A3B

2026-04-12

#AI #LLM #NVIDIA #DGX Spark #vLLM #Tensor Parallel

记录首次在两台 DGX Spark 上以 vLLM TP=2 方式部署 Qwen3.5-35B-A3B 的过程与 benchmark 结果。

[Read more]

Codex CLI 对接远程 Ollama

2026-04-10

#ai #ollama #codex-cli #tailscale #homelab

记录如何通过 Tailscale 组网和 Codex CLI 自定义 Provider 配置，把本地 AI 编码助手接到远程 Homelab 上的 Ollama 服务。

[Read more]

读 Anthropic《How AI Impacts Skill Formation》：AI 如何影响编程能力的形成

2026-04-08

#AI #Programming #Learning #Efficiency

整理 Anthropic 这篇 preprint 论文：学新工具时太依赖 AI，可能会让调试和理解概念变弱，但这个结论还要放回样本规模和具体任务里看。

[Read more]

Posts for: #AI