一、Skill 定位 #
Self-Improvement 的核心是让 Agent 不只是执行任务,而是能够基于结果质量持续优化自身工作方式。
它适合做“长期有效”的流程:任务复盘、提示词改写、失败归因、策略升级。
二、适用场景 #
- 同类任务反复执行,但输出质量不稳定。
- 团队希望沉淀“高质量提示词模板”。
- 需要建立可审计的优化闭环,而不是靠经验拍脑袋。
- 想让新人快速复用成熟流程,缩短学习曲线。
三、安装与配置 #
1) 安装命令 #
clawhub install self-improvement
clawhub sync --all
2) 建议准备的输入数据 #
- 历史任务日志(成功与失败样本都要有)。
- 输出评分标准(准确性、完整性、可执行性)。
- 业务约束(禁用词、合规规则、时效要求)。
四、使用方法(建议流程) #
Step 1:定义评估标准 #
先把“什么叫好答案”说清楚,再让 Skill 参与优化。
示例标准:
- 结论必须可执行。
- 必须给出关键依据。
- 不允许出现无来源断言。
Step 2:执行首轮复盘 #
/skill self-improvement
请基于最近 20 条任务输出,按“成功原因/失败原因/可改进提示词”三栏给出复盘报告。
Step 3:生成优化后的模板 #
/skill self-improvement
针对“技术文档总结”场景,输出 v2 提示词模板,并说明相对 v1 的改动理由。
Step 4:A/B 验证 #
把旧模板与新模板并行跑一周,比较稳定性与人工返工率。
五、注意事项 #
- 不要只看单次结果:至少观察 1-2 周趋势。
- 避免过拟合:模板不要只针对单一案例优化。
- 要保留回滚版本:v2 效果差时能迅速退回 v1。
- 加入人工验收节点:关键业务不能完全自动放行。
- 明确禁区:涉及合规、财务、法务的内容必须人工复核。
六、常见问题与排查 #
- 优化后反而变差:检查评估指标是否与业务目标一致。
- 输出越来越长:在模板中显式限制结构与长度。
- 解释很多但不可执行:增加“最终动作列表”硬性要求。
七、落地清单 #
- 建立统一评分标准与评审表。
- 每周固定一次复盘与模板迭代。
- 维护模板版本库(含变更记录)。
- 对关键场景设置人工验收门槛。
- 每月复盘一次 ROI(节省时间/返工率变化)。
八、参考资料 #
- Self-Improvement Skill:https://github.com/sundial-org/awesome-openclaw-skills/tree/main/skills/self-improvement
- OpenClaw Skills 文档:https://docs.openclaw.ai/skills