我把 Agent Skills 的开放规范、SWE-Skills-Bench 的实证结果,以及 Daniel Sogl 对 skill eval 的反思放在一起看,试着回答三个问题:skill 适合解决什么问题、什么时候值得投入,以及为什么没有 eval 的 skill 很容易变成一份没人验证的 Markdown。
Posts for: #ai-agent
Claude Code 为什么会拒绝我?harness 与 vibe coding 时代的工程边界
从一次被 Claude Code 拒绝的 git push 出发,结合最近几个月能查到的官方文档、CVE、论文与失败案例,整理 vibe coding 时代为什么需要工程边界、Claude Code 的 harness 如何分层,以及其他 AI 编码 agent 的不同取舍。
为什么不少 AI Agent 会用 Git Worktree?一篇 Worktree 学习笔记
本文记录我学习 Git Worktree 的过程,顺带解释为什么像 Claude Code 和 Gemini CLI 这样的 AI Coding Agents 经常会用它来并行处理任务。