Posts for: #Gemma

Apple M5 上 omlx + Gemma4-26B 性能调优实录

2026-04-19

#AI #LLM #MLX #omlx #Apple Silicon #M5 #Gemma #Benchmark

基于一次 M5 本地测试，记录 MoE 模型带宽瓶颈，以及通过内存热缓存把长上下文推理提速到约 6.4 倍的过程。

[Read more]