Backtest Expert技能使用说明
回测专家
基于专业方法论的系统化交易策略回测方法,其核心是优先考虑稳健性而非追求乐观结果。
核心理念
目标:寻找“出错最少”的策略,而非在纸面上“盈利最多”的策略。
原则:增加摩擦、压力测试假设,观察哪些能够存活。如果一个策略在悲观条件下依然坚挺,那么它在实盘交易中更有可能成功。
何时使用此技能
在以下情况使用此技能:
- 开发或验证系统化交易策略时
- 评估交易想法是否足够稳健以用于实盘实施时
- 排查回测结果可能产生误导的原因时
- 学习正确的回测方法时
- 规避常见陷阱时(例如曲线拟合、前视偏差、幸存者偏差)
- 评估参数敏感性和机制依赖性时
- 为滑点和执行成本设定现实预期时
回测工作流程
1. 陈述假设
用一句话定义优势。
示例:"那些在财报发布后开盘涨幅超过3%、且在一小时内回撤至前一日收盘价的股票,提供了均值回归的交易机会。"
如果你无法清晰地阐述优势,就不要进行测试。
2. 以零主观判断的方式编码规则
用完全明确的细节定义:
- 入场:精确条件、时机、价格类型
- 出场:止损、止盈目标、基于时间的出场
- 仓位规模:固定金额、投资组合百分比、波动率调整
- 过滤器:市值、成交量、行业板块、波动率条件
- 交易范围:哪些标的符合资格
关键要求:不允许任何主观判断。每个决策都必须是基于规则的、明确无误的。
3. 运行初步回测
测试结束:
- 至少5年(最好是10年以上)
- 多种市场状态(牛市、熊市、高/低波动率)
- 真实成本:佣金 + 保守估计的滑点
检查初步结果的基本可行性。如果基础逻辑存在问题,则对假设进行迭代调整。
4. 对策略进行压力测试
这应占测试时间的80%。
参数敏感性:
- 测试止损点为基准的50%、75%、100%、125%、150%
- 测试止盈点为基准的80%、90%、100%、110%、120%
- 将入场/出场时间调整±15-30分钟
- 寻找性能稳定的“平台区”,而非狭窄的峰值
执行摩擦:
- 将滑点增加至典型估计值的1.5-2倍
- 模拟最差成交情况(以卖一价+1个最小变动单位买入,以买一价-1个最小变动单位卖出)
- 加入现实订单被拒场景
- 使用悲观的佣金结构进行测试
时间稳健性:
- 逐年分析表现
- 要求大多数年份具有正向期望
- 确保策略不依赖于1-2个特殊时期
- 在不同市场环境中分别测试
样本量:
- 绝对最小值:30笔交易
- 推荐值:100笔以上交易
- 高置信度:200笔以上交易
5. 样本外验证
滚动前进分析:
- 在训练期优化(例如,第1-3年)
- 在验证期测试(第4年)
- 向前滚动并重复
- 比较样本内与样本外表现
警示信号:
- 样本外表现不及样本内表现的50%
- 需要频繁重新优化参数
- 参数在不同周期间剧烈变化
6. 评估结果
需要回答的问题:
- 在悲观假设下,优势能否保持?
- 表现是否在不同参数变化下保持稳定?
- 策略在多种市场环境中是否有效?
- 样本量是否足以满足统计置信度?
- 结果是否现实,而非“好得不真实”?
决策标准:
- ✅部署:通过所有压力测试,且表现可接受
- 🔄优化:核心逻辑合理,但需要调整参数
- ❌放弃:未能通过压力测试,或依赖于脆弱假设
核心测试原则
严苛评估策略
处处增加摩擦:
- 佣金高于实际水平
- 滑点设为典型的1.5-2倍
- 按最坏情况成交
- 订单遭拒
- 部分成交
原理:能在悲观假设下存活的策略,在实际交易中往往表现更佳。
寻求稳定区间,而非峰值
寻找表现稳定的参数范围,而非产生性能尖峰的单一最优值。
良好示例:策略在止损点位于1.5%至3.0%的任何位置都能盈利不良示例:策略仅在止损点精确设为2.13%时才有效
稳定的表现表明策略具有真实优势;狭窄的最优值则暗示存在过度拟合。
测试所有情况,而非精选案例
错误方法:仅研究手动挑选的、曾有效的“市场领跑者”正确的方法:对所有符合标准的股票进行测试,包括那些失败的案例
选择性举例会带来生存者偏差,并高估策略质量。
将想法生成与验证分离
直觉:有助于生成假设验证:必须纯粹基于数据驱动
绝不要让对某个想法的情感依恋影响测试结果的解读。
常见的失败模式
尽早识别这些模式以节省时间:
- 参数敏感性:仅在特定参数值下有效
- 特定市场环境依赖:在某些年份表现优异,在其他年份表现糟糕
- 交易成本敏感性:加入实际成本后变得无利可图
- 样本量过小:交易次数太少,缺乏统计置信度
- 前瞻性偏差"好得令人难以置信"的结果
- 过度优化:参数过多,样本外结果不佳
详见references/failed_tests.md以获取详细示例和诊断框架。
可用参考文档
方法论参考
文件:references/methodology.md
何时阅读:需要特定测试技术的详细指导时。
内容:
- 压力测试方法
- 参数敏感性分析
- 滑点和摩擦建模
- 样本量要求
- 市场状态分类
- 常见偏差与陷阱(生存偏差、前瞻偏差、曲线拟合等)
测试失败参考
文件:参考资料/失败的测试.md
何时阅读: 当策略测试失败时,或从过去的错误中学习时。
内容:
- 失败为何有价值
- 常见的失败模式及示例
- 案例研究文档框架
- 回测评估的红旗清单
重要提醒
时间分配: 花20%的时间生成想法,80%的时间尝试推翻它们。
无上下文要求: 如果策略需要“完美上下文”才能运作,那么它对于系统性交易来说就不够稳健。
红旗警示: 如果回测结果看起来过于完美(>90%的胜率,最小的回撤,完美的时机),请仔细审查是否存在前瞻性偏差或数据问题。
工具限制: 了解你的回测平台的特性(插值方法、低流动性处理、数据对齐问题)。
统计显著性: 微小的优势需要大量样本才能验证。每笔交易5%的盈利优势需要100次以上的交易记录才能与运气因素区分开。
主观判断与系统化策略的差异
本技能专注于系统化/量化回测方法,其特点是:
- 所有规则均预先编码设定
- 执行过程杜绝主观判断或"直觉"干预
- 测试覆盖全部历史案例,而非精选特例
- 刻意排除新闻、宏观等情境因素
主观型交易者的研究方法不同——本技能可能不适用于需要主观判断的交易情境。


微信扫一扫,打赏作者吧~