部署与监控基线
量化系统上线后,工程质量主要体现在发布是否稳定、故障是否可观测、问题是否可回放。
基线目标
部署与监控的价值不是“把系统跑起来”,而是让每次变更都能被验证、每次故障都能被定位、每次异常都能被复盘。
基线要求
- 部署过程自动化,可回滚。
- 核心任务具备成功率和耗时监控。
- 策略、数据和执行链路都有独立告警。
- 故障事件有统一记录和复盘模板。
部署链路建议
- 构建阶段:产物版本号、依赖校验、基础测试。
- 发布阶段:灰度范围、回滚开关、关键任务验证。
- 观察阶段:首轮调度、首批数据、核心告警面板。
- 复盘阶段:变更记录、异常结论、后续修复计划。
建议监控面板
- 数据更新时间
- 任务失败数
- 回测任务耗时
- 实盘订单成功率
- 研究环境资源占用
故障记录最低字段
- 事件时间和影响范围。
- 涉及的服务、任务和数据集。
- 临时止损动作。
- 根因和后续修复项。
评论区待配置
将 Giscus 仓库参数补齐后,这里会显示评论区。
OWNER/REPO