<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>codex-cli on </title>
    <link>/tags/codex-cli/</link>
    <description>Recent content in codex-cli on </description>
    <generator>Hugo -- gohugo.io</generator>
    <language>en</language>
    <lastBuildDate>Fri, 10 Apr 2026 09:00:00 +0800</lastBuildDate><atom:link href="/tags/codex-cli/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Codex CLI 对接远程 Ollama</title>
      <link>/posts/codex-cli-remote-ollama/</link>
      <pubDate>Fri, 10 Apr 2026 09:00:00 +0800</pubDate>
      
      <guid>/posts/codex-cli-remote-ollama/</guid>
      <description>最近开始尝试用 AI agent 来帮我处理一些相对明确的自动化分析和整理任务。论模型能力，GitHub Copilot 免费提供的 GPT-5 mini 可能比我本地部署的模型更强，但它有速率限制，跑多了就被限。本地模型的好处在于不受限制，而且可以自己调整参数和提示词来适应具体的需求场景。
我的 Homelab 服务器上正好跑着 Ollama，于是就想能不能让本地的 Codex CLI 直接用远程服务器的模型来干活。试了一圈后找到了可行的配置方式，这里记录一下。
整体架构 本地 MacBook (Codex CLI) │ │ Tailscale 虚拟局域网 │ http://100.x.x.x:11434/v1 ▼ 远程 Homelab (Ollama) │ ├── qwen3.5:latest (日常编码) ├── gemma4:26b (深度推理) └── gemma4:31b (复杂架构设计) Tailscale 负责打通网络，Ollama 提供 OpenAI 兼容 API，Codex CLI 通过自定义 Provider 接入远程模型。请求流量都留在 Tailnet 内，至少不需要经过公网转发。
远程服务器：Ollama 配置 1. 允许监听所有网卡 Ollama 默认只监听 127.0.0.1，如果你想让它接受来自 Tailscale 网卡的请求，通常要改为监听 0.0.0.0。
如果你用 systemd 管理 Ollama，创建 override 配置：
sudo systemctl edit ollama.</description>
    </item>
    
  </channel>
</rss>
