Smart Model Switching
智能模型切换
三层Claude路由:俳句 → 十四行诗 → 奥普斯
从最便宜的模型开始。仅在需要时升级。可节省50-90%的API成本。
黄金法则
如果一项任务需要人类集中思考超过30秒,则从俳句升级到十四行诗。 如果任务涉及架构设计、复杂的权衡取舍或深度推理,则升级到奥普斯。
成本实况
| 模型 | 输入 | 输出 | 相对成本 |
|---|---|---|---|
| 俳句 | $0.25/百万tokens | $1.25/百万tokens | 1倍(基准) |
| 十四行诗 | $3.00/百万tokens | $15.00/百万tokens | 12倍 |
| 奥普斯 | $15.00/百万tokens | $75.00/百万tokens | 60倍 |
核心结论:选错模型会浪费金钱或时间。简单任务用Haiku,标准任务用Sonnet,复杂任务用Opus。
💚 HAIKU — 简单任务的默认选择
以下情况请继续使用 Haiku:
- 事实性问答 — "什么是 X"、"Y 是谁"、"Z 何时发生"
- 快速查询 — 定义、单位换算、简短翻译
- 状态检查 — 日历、文件读取、会话监控
- 心跳检测 — 定期检查,HEARTBEAT_OK 响应
- 记忆与提醒 — "记住这个"、"提醒我..."
- 日常对话 — 问候、闲聊、确认
- 简单文件操作 — 读取、列表、基本写入
- 单行任务 — 任何能用一两句话回答的事情
切勿在 Haiku 上执行以下操作
- ❌ 编写超过 10 行的代码
- ❌ 创建对比表格
- ❌ 撰写超过 3 个段落
- ❌ 进行多步骤分析
- ❌ 撰写报告或提案
💛 SONNET — 标准工作(主力模型)
提升至 Sonnet 处理:
代码与技术
- 代码生成 — 编写函数、构建功能、脚本
- 代码审查 — PR 审查、质量检查
- 调试 — 标准错误排查
- 文档编写 — README、注释、用户指南
分析与规划
- 分析与评估 — 方案比较、权衡评估
- 规划 — 项目计划、路线图、任务分解
- 研究综合 — 整合多源信息
- 多步推理 — "首先...然后...最后..."
写作与内容
- 长篇幅写作 — 报告、提案、文章(>3 段落)
- 创意写作 — 博客文章、描述文案、广告文案
- 摘要 — 长文档、转录稿
- 结构化输出 — 表格、大纲、格式化文档
❤️ OPUS — 仅限复杂推理
提升至 Opus 处理:
架构与设计
- 系统架构决策
- 主要代码库重构
- 权衡利弊的设计模式选择
- 数据库模式设计
深度分析
- 复杂调试(多文件、竞态条件)
- 安全审查
- 性能优化策略
- 微妙错误的根本原因分析
战略性与创造性
- 战略规划——业务决策、路线图
- 细微判断——伦理、模糊性、相互冲突的价值观
- 深入研究——全面的多来源分析
🔄 实施
对于子代理
```javascript // 常规监控 sessions_spawn(task="检查备份状态", model="haiku")
// 标准代码工作
sessions_spawn(task="构建REST API端点", model="sonnet")
// 架构决策 sessions_spawn(task="为多租户设计数据库模式", model="opus") ```
对于定时任务
```json { "payload": { "kind": "agentTurn", "model": "haiku" } } ``` 除非任务确实需要推理,否则定时任务一律使用Haiku模型。
📊 快速决策树
``` 是问候、查找、状态检查或1-2句回答吗? 是 → HAIKU 否 ↓
是代码、分析、规划、写作或多步骤任务吗?
是 → SONNET
否 ↓
是架构设计、深度推理或关键决策吗? 是 → OPUS 否 → 默认使用SONNET,若处理困难则升级 ```
📋 速查卡
``` ┌─────────────────────────────────────────────────────────────┐ │ 智能模型切换系统 │ │ 俳句 → 十四行诗 → 奥珀斯 │ ├─────────────────────────────────────────────────────────────┤ │ 💚 俳句模式(最经济) │ │ • 问候、状态查询、快速检索 │ │ • 事实问答、定义解释、提醒事项 │ │ • 简单文件操作、1-2句话的简短回答 │ ├─────────────────────────────────────────────────────────────┤ │ 💛 十四行诗模式(标准) │ │ • 超过10行的代码编写与调试 │ │ • 分析对比、方案规划 │ │ • 报告撰写、提案拟定、长文本创作 │ ├─────────────────────────────────────────────────────────────┤ │ ❤️ 奥珀斯模式(复杂任务) │ │ • 架构决策 │ │ • 复杂调试、多文件重构 │ │ • 战略规划、深度研究 │ ├─────────────────────────────────────────────────────────────┤ │ 💡 核心规则:若人类需思考超30秒 → 自动升级模型 │ │ 💰 成本比例:俳句 1x → 十四行诗 12x → 奥珀斯 60x │ └─────────────────────────────────────────────────────────────┘ ```
专为仅使用Claude模型(俳句/十四行诗/奥珀斯)的环境设计。 灵感源自成本节约技巧,并扩展为三层渐进式智能切换机制。


微信扫一扫,打赏作者吧~