在 M2 MacBook Pro (32GB) 上系统对比 MLX 与 Ollama 的推理性能,附 9B 与 35B 模型的实测数据。
Posts for: #ollama
Spring AI 2.0.0-M2 的 Ollama think 字段污染 Bug:排查过程与 Interceptor 临时方案
记录 Spring AI 2.0.0-M2 中 OllamaChatOptions.disableThinking() 导致 Ollama 返回 HTTP 400 的 bug,分析根因、对比两种绕过方案的 tradeoff,最终选择 ClientHttpRequestInterceptor 作为最小侵入的临时修复。