<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>ai-agent on </title>
    <link>/tags/ai-agent/</link>
    <description>Recent content in ai-agent on </description>
    <generator>Hugo -- gohugo.io</generator>
    <language>en</language>
    <lastBuildDate>Wed, 06 May 2026 10:00:00 +0800</lastBuildDate><atom:link href="/tags/ai-agent/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>我怎么理解 AI Agent Skills：规范、实证，以及落地时的取舍</title>
      <link>/posts/agent-skills-spec-and-evals/</link>
      <pubDate>Wed, 06 May 2026 10:00:00 +0800</pubDate>
      
      <guid>/posts/agent-skills-spec-and-evals/</guid>
      <description>至少从 2025 年下半年到我写这篇（2026-05-06）这段产品叙事看，&amp;ldquo;Agent Skills&amp;quot;是一个在 AI 工具圈快速升温的概念：Anthropic 在 Claude / Claude Code 里推它，Cursor、GitHub Copilot、Gemini CLI、OpenCode、Goose、Roo Code 等一批工具也陆续宣布支持，agentskills.io 则把它整理成了一个开放标准。至少在叙事层面，它确实有点像 AI 工具圈想长出来的一个&amp;quot;USB-C 接口&amp;rdquo;。
但热闹归热闹，更冷静的那一面是：skill 真的有用吗？什么时候有用？怎么知道它有用？ 这一篇我把三份资料串起来聊一下：
agentskills.io 给出 skill 的开放定义和加载机制； SWE-Skills-Bench 用基准实测提醒我们：公开 skill 在真实仓库里未必会带来增益； Angular 社区开发者 Daniel Sogl 那篇 Skills Without Evals Are Just Markdown and Hope，把 skill 的两种隐性失败模式说得很透。 我现在更愿意把 skill 拆成两个层面来看：规范层面，它解决的是上下文如何按需分发；工程效果层面，它解决的是这份指令包能不能在你当前仓库里产生净增益。 前者解释它为什么会流行，后者决定它值不值得进你的工作流。
Agent Skills 是什么 按照 agentskills.io 的定义，一个 skill 本质上就是一个文件夹 + 一个 SKILL.md：
my-skill/ ├── SKILL.md # 必需：metadata + 指令 ├── scripts/ # 可选：可执行脚本 ├── references/ # 可选：参考文档 ├── assets/ # 可选：模板、资源 └── .</description>
    </item>
    
    <item>
      <title>Claude Code 为什么会拒绝我？harness 与 vibe coding 时代的工程边界</title>
      <link>/posts/claude-code-harness-vibe-coding-2026/</link>
      <pubDate>Sun, 26 Apr 2026 02:00:00 +0800</pubDate>
      
      <guid>/posts/claude-code-harness-vibe-coding-2026/</guid>
      <description>📦 本文基于的完整项目源码：meirongdev/shop
开场：一次被拒绝的 git push 让 Claude Code 帮我把一批 commits 推到 origin/main，得到的不是成功，是一段克制但毫不含糊的拒绝：
Permission for this action has been denied. Reason: Pushing directly to main bypasses PR review; commits should go to a feature branch. 奇怪的是，我的项目 .claude/settings.local.json 里有 142 条 Bash(...) allow 规则，却没有任何 deny；用户级 ~/.claude/settings.json 也只配了 permissions.defaultMode: &amp;quot;auto&amp;quot; 一行。这条拦截看起来是凭空冒出来的——但它的措辞具体到了&amp;quot;PR review&amp;quot;和&amp;quot;feature branch&amp;quot;，又像是某个真人写过的策略。
这篇文章想顺着这条具体的拒绝信息往下挖：到底是哪一层在拦？为什么 2026 年的 AI 编码 agent 普遍都在补这种&amp;quot;边界&amp;quot;设计？vibe coding 失控时的代价可能有多大？业界其他 agent 又选择了哪些不一样的取舍？
文中尽量给出我能找到的引用，并优先保留我这次还能访问到的 URL。
一、拦截到底是哪一层做的？ Q：先验证一下，是不是有人写了 deny rule？
我把 settings 翻了一遍，没有 deny。Claude Code 的官方权限文档写得很清楚：deny rules 是最高优先级，但没有内置的&amp;quot;危险命令&amp;quot;自动阻止列表——rm -rf /、git push origin main 之类都不在 hardcoded blacklist 里。换句话说，这个拦截不来自某个静态规则。</description>
    </item>
    
    <item>
      <title>为什么不少 AI Agent 会用 Git Worktree？一篇 Worktree 学习笔记</title>
      <link>/posts/git-worktree-study/</link>
      <pubDate>Fri, 20 Mar 2026 22:15:00 +0800</pubDate>
      
      <guid>/posts/git-worktree-study/</guid>
      <description>最近在使用各种 AI Coding Agents（如 Claude Code, Gemini CLI）进行开发时，我发现它们在后台处理复杂任务时，经常会用到 &amp;ldquo;Worktree&amp;rdquo;。于是我顺手补了一轮 Git Worktree 的基础知识，也想弄清楚这些工具为什么偏爱它。
那么，到底什么是 Git Worktree？为什么这些工具和一些开发者会愿意用它？
1. 什么是 Git Worktree？ 简单来说，git worktree 允许你在同一个仓库中同时拥有多个工作目录。
“平行宇宙”模型 通常情况下，一个 Git 仓库只有一个工作目录（Working Directory）。当你执行 git checkout branch-b 时，Git 会直接修改你当前目录下的所有文件。如果你当前的代码还没写完（比如正在进行一项复杂的重构），你就得先执行 git stash 或者临时提交一个不完整的 commit，才能切换分支去修 Bug。
而 git worktree 就像是为你创建了多个“平行宇宙”：
主工作目录 (Main Worktree)：你通过 git clone 或 git init 创建的那个原始目录。 链接工作目录 (Linked Worktree)：你通过 git worktree add 创建的其他目录。 这些目录共享同一个 .git 文件夹（包括对象库、提交历史等），但它们各自检出了不同的分支，且互不干扰。
2. Worktree vs. Clone vs. Checkout 为了更直观地理解，我们可以通过下表进行对比：
特性 git checkout git clone git worktree 存储方式 单一目录切换 独立副本 多目录共享 .</description>
    </item>
    
  </channel>
</rss>
