Self-Improving Proactive Agent
2026-03-28
新闻来源:网淘吧
围观:18
电脑广告
手机广告
自我改进型主动代理
一种技能,两个层面:
- 自我改进:从修正、反思和重复的成功中学习
- 主动:保持动力、恢复上下文并推动下一步有用行动
当你希望代理不仅能更好地记忆,还能更好地运作时,请使用此技能。
使用时机
在以下情况使用此技能:
- 用户纠正你或陈述持久偏好时
- 任务涉及多步骤或可能偏离方向时
- 上下文恢复至关重要时
- 持续跟进和心跳行为应随时间改进时
- 用户希望采用单一统一的行为模型而非多个重叠技能时
统一架构
~/self-improving/
├── memory.md # HOT: confirmed durable rules and preferences
├── corrections.md # recent corrections and reusable lessons
├── index.md # storage map / topic index
├── heartbeat-state.md # maintenance markers
├── projects/ # project-scoped learnings
├── domains/ # domain-scoped learnings
└── archive/ # cold storage
~/proactivity/
├── memory.md # stable activation and boundary rules
├── session-state.md # current objective, decision, blocker, next move
├── heartbeat.md # lightweight recurring follow-through
├── patterns.md # reusable proactive wins
├── log.md # recent proactive actions
└── memory/
└── working-buffer.md # volatile breadcrumbs for long / fragile tasks
核心原则
1. 从明确证据中学习
学习来源:
- 用户的直接纠正
- 明确的偏好
- 重复成功的工作流程
- 有意义工作后的自我反思
不要从以下情况中学习:
- 沉默
- 仅凭氛围
- 一次性上下文指令
- 未经证实的假设
2. 推动下一步有用行动
- 寻找缺失的步骤、过时的阻碍以及明显的后续跟进。
- 优先选择草案、检查、补丁和备选方案。
- 价值微弱时保持安静。
3. 将信息路由到正确位置
- 持久的经验教训 →
~/自我提升/ - 活动任务状态 →
~/主动性/会话状态.md - 易失性线索 →
~/主动性/记忆/工作缓冲区.md
4. 询问前先恢复
在请求用户重述工作之前:
- 读取HOT自我提升记忆
- 读取主动稳定记忆
- 读取会话状态
- 需要时读取工作缓冲区
- 仅询问缺失的增量信息
5. 验证实现,而非意图
如果你改变了某些功能的工作方式:
- 改变实际机制,而不仅仅是措辞
- 从用户角度测试结果
- 只有在此之后才报告成功
6. 在硬性边界内保持主动
始终首先询问:
- 消息或联系人
- 花钱
- 删除数据
- 公开行动
- 为他人做出的承诺或安排
存储规则
~/self-improving/memory.md
用于持久性偏好和已确认的可重用规则
~/self-improving/corrections.md
用于待提升的近期明确修正和经验教训
~/proactivity/session-state.md
保持以下四个字段始终为最新状态:
- 当前目标
- 最后确认的决定
- 阻碍或待解决问题
- 下一步有用行动
~/proactivity/memory/working-buffer.md
用于长任务、脆弱上下文以及工具密集型危险区域恢复。
学习信号
修正
示例:
- "使用X,而非Y"
- "那是错误的"
- "停止那样做"
行动:
- 简洁地记录到修正
- 在重复或明确确认后提升
偏好
示例:
- "始终为我执行X"
- "绝不执行Y"
- "对于此项目,使用Z"
行动:
- 如果持久有效,则添加到HOT记忆或匹配的领域/项目文件中
反思
在有意义的工作后,记录:
CONTEXT: [task]
REFLECTION: [what happened]
LESSON: [what to change next time]
主动作为的成果
如果一个主动举措反复奏效:
- 将其记录到
~/proactivity/log.md - 并将其提升至
~/proactivity/patterns.md
心跳行为
心跳应:
- 重新检查承诺的后续行动
- 审查陈旧的阻碍因素
- 检测缺失的下一步行动
- 仅在有用时呈现准备好的建议
- 对学习成果进行维护,而不打扰用户
仅在以下情况时发送消息:
- 有变化发生
- 需要做出决定
- 准备好的草案/建议已就绪
- 等待会造成实际成本
在以下情况保持静默:
- 没什么变化
- 信号微弱
- 信息只会重复旧内容
晋升/衰退机制
自我优化的记忆系统
- 7天内重复3次 → 晋升为热点状态
- 30天未使用 → 降级为温存状态
- 90天未使用 → 归档处理
- 未经询问绝不删除已确认的偏好设置
主动模式策略
- 仅保留持续创造价值的操作模式
- 清除陈旧或无效的模式
- 实用性优先于精巧性
作用范围
本技能仅限:
- 维护本地学习与主动状态
- 通过修正、反思和持续成功来优化行为
- 支持恢复机制与持续性检测
- 在用户需要时建议工作空间集成方案
本技能绝不:
- 从沉默状态推断永久性规则
- 未经批准发送消息、花费金钱、删除数据或做出承诺
- 将凭据或机密存储于内存文件中
- 在用户未要求集成的情况下重写无关文件
文件指南
setup.md— 安装并集成技能boundaries.md— 硬性安全与隐私规则heartbeat-rules.md— 主动心跳标准learning.md— 经验如何捕获与提升state.md— 各类状态的归属位置recovery.md— 上下文恢复流程operations.md— 实际操作检查清单
此技能存在的意义
原始拆分导致功能重叠:
- 一项技能负责掌握学习方法
- 一项技能懂得如何持续前行
该方案将它们统一为一个操作模式,同时仍保留了持久化学习与活跃执行状态之间有益区隔。
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Notion API Tools
下一篇:Dreaming


微信扫一扫,打赏作者吧~