agent-skills on

agent-skills on /tags/agent-skills/ Recent content in agent-skills on Hugo -- gohugo.io en Wed, 06 May 2026 10:00:00 +0800 我怎么理解 AI Agent Skills：规范、实证，以及落地时的取舍 /posts/agent-skills-spec-and-evals/ Wed, 06 May 2026 10:00:00 +0800 /posts/agent-skills-spec-and-evals/ 至少从 2025 年下半年到我写这篇（2026-05-06）这段产品叙事看，“Agent Skills"是一个在 AI 工具圈快速升温的概念：Anthropic 在 Claude / Claude Code 里推它，Cursor、GitHub Copilot、Gemini CLI、OpenCode、Goose、Roo Code 等一批工具也陆续宣布支持，agentskills.io 则把它整理成了一个开放标准。至少在叙事层面，它确实有点像 AI 工具圈想长出来的一个"USB-C 接口”。但热闹归热闹，更冷静的那一面是：skill 真的有用吗？什么时候有用？怎么知道它有用？这一篇我把三份资料串起来聊一下： agentskills.io 给出 skill 的开放定义和加载机制； SWE-Skills-Bench 用基准实测提醒我们：公开 skill 在真实仓库里未必会带来增益； Angular 社区开发者 Daniel Sogl 那篇 Skills Without Evals Are Just Markdown and Hope，把 skill 的两种隐性失败模式说得很透。我现在更愿意把 skill 拆成两个层面来看：规范层面，它解决的是上下文如何按需分发；工程效果层面，它解决的是这份指令包能不能在你当前仓库里产生净增益。前者解释它为什么会流行，后者决定它值不值得进你的工作流。 Agent Skills 是什么按照 agentskills.io 的定义，一个 skill 本质上就是一个文件夹 + 一个 SKILL.md： my-skill/ ├── SKILL.md # 必需：metadata + 指令 ├── scripts/ # 可选：可执行脚本 ├── references/ # 可选：参考文档 ├── assets/ # 可选：模板、资源 └── .