Apple M5 上 omlx + Gemma4-26B 性能调优实录 2026-04-19 #AI #LLM #MLX #omlx #Apple Silicon #M5 #Gemma #Benchmark 基于一次 M5 本地测试,记录 MoE 模型带宽瓶颈,以及通过内存热缓存把长上下文推理提速到约 6.4 倍的过程。 [Read more]