AEO · Agent效果运营平台

Agent可控性持续提升

Skill越来越多,Agent悄悄变笨。AEO监控任务效果,及时告诉KIVO如何沉淀知识,SEVO如何加固可控性

适合经常调整模型、工具、规则和知识库的人。它把“感觉好像变差了”变成可追踪、可验证的改进流程。

AEO 效果监控仪表盘主图
效果异常监控+根因分析,修复后不再犯效果可控性下滑后及时找出根因来解决
质量曲线异常告警根因分析前后对比
Value

AEO的价值

Benchmark自动评测

完成率、耗时、错误率、质量评分持续记录,不靠拍脑袋。

效果变差自动告警

最近结果明显偏离正常水平时,自动发出告警。

Badcase根因分析

把下降和模型、工具、规则、知识变化关联起来。

效果基线只升不降

优化方案执行后对比前后效果,没改善就继续优化。

1
持续记录结果每次任务完成后留下效果数据和上下文。
2
对比正常水平近期表现和历史稳定期对比,找出异常。
3
分析最近改动回看模型、规则、工具、知识库变化。
4
验证修复效果优化后继续对比,确认真的恢复。
及时发现Agent效果变差。

AEO 让效果变化提前暴露出来。你能更早知道哪里出了问题,先修掉,再继续扩大使用。

First run

5 分钟内看到结果。

AEO 的首次体验不从空白数据库开始。先用样例跑通,再接入你的真实任务。

个人操盘

少重复交代背景,把精力放在目标判断和关键决策上。

团队协作

多人、多 Agent 协作时,流程、状态和证据都能被追踪。

长期运营

每次改进都留下证据,后续继续复用和放大。

一键接入OpenClaw

作者构建中,待发布。

安装后先走第一个样例,看到真实输出,再决定接入多深。

npm install @self-evolving-harness/aeo