V5.2 策略进化路线图
信号引擎V5.2 — 数据驱动的策略迭代框架,将信号源视为特征、权重视为模型参数,通过模拟盘持续优化
V5.2 策略进化路线图
优先级:P0(最高) | 负责人:露露 | 创建:2026-02-28
一、核心思路 ⭐⭐⭐
信号源 = 特征(Feature)
每一个数据源都是模型的一个输入特征。特征越多、越有效,模型的预测能力越强。
当前V5.1的5层评分体系,本质上就是一个手动设计的线性模型:
总分 = W1×方向层 + W2×拥挤层 + W3×环境层 + W4×确认层 + W5×辅助层权重 = 模型参数(Parameter)
当前权重是人工拍的(45/20/15/15/5),不一定是最优的。
目标:用真实交易数据(模拟盘+实盘),自动学习每个特征的最优权重。
迭代循环(正向飞轮)
┌─────────────────────────────────────────────┐
│ │
│ ① 加入新信号源(特征) │
│ ↓ │
│ ② 模拟盘跑数据(每笔记录5层分数+盈亏) │
│ ↓ │
│ ③ 分析数据(哪些特征有效、最优权重) │
│ ↓ │
│ ④ 调整权重 / 加减特征 │
│ ↓ │
│ ⑤ 实盘验证 │
│ ↓ │
│ ⑥ 数据反馈 → 回到① │
│ │
│ 数据越多 → 模型越准 → 赚越多 → 数据越多 │
│ │
└─────────────────────────────────────────────┘这就是量化交易的核心方法论,和大模型训练思路一样:
- 大模型:数据 → 特征提取 → 权重训练 → 验证 → 迭代
- 信号引擎:行情数据 → 信号源/指标 → 评分权重 → 模拟盘验证 → 调参迭代
护城河:积累的数据和调优后的参数,是别人无法复制的。
二、当前架构(V5.1)
已有信号源(特征)
| 层 | 权重 | 信号源 | 数据来源 | 状态 |
|---|---|---|---|---|
| 方向层 | 45分 | CVD_fast(30m) | agg_trades计算 | ✅ 真实数据 |
| 方向层 | - | CVD_mid(4h) | agg_trades计算 | ✅ 真实数据 |
| 方向层 | - | P99大单流 | agg_trades计算 | ✅ 真实数据 |
| 方向层 | +5 | CVD加速度 | agg_trades计算 | ✅ 真实数据 |
| 拥挤层 | 20分 | 多空比 | 币安API globalLongShortAccountRatio | ✅ 真实数据 |
| 拥挤层 | - | 大户持仓比 | 币安API topLongShortAccountRatio | ✅ 真实数据 |
| 环境层 | 15分 | OI变化率 | 币安API openInterestHist | ✅ 真实数据 |
| 确认层 | 15分 | 多时间框架CVD一致性 | agg_trades计算 | ✅ 真实数据 |
| 辅助层 | 5分 | Coinbase Premium | 币安+CB价差 | ✅ 真实数据 |
每笔交易记录的数据
{
"score": 85,
"score_factors": {
"direction": {"score": 45, "cvd_fast": 15, "cvd_mid": 15, "p99_flow": 15, "accel_bonus": 5},
"crowding": {"score": 15, "long_short_ratio": 10, "top_trader_position": 5},
"environment": {"score": 10, "open_interest_hist": 0.02},
"confirmation": {"score": 15},
"auxiliary": {"score": 5, "coinbase_premium": 0.0012}
},
"pnl_r": 2.25,
"status": "tp"
}三、V5.2 待加入信号源(按优先级)
第一批(数据容易获取)
| 信号源 | 类型 | 获取方式 | 预期价值 |
|---|---|---|---|
| 资金费率(Funding Rate) | 拥挤指标 | 币安API /fapi/v1/fundingRate | 高 — 极端FR是反转信号 |
| 清算数据(Liquidation) | 情绪指标 | 币安WS forceOrder | 高 — 大额清算=趋势加速 |
| 期权PCR(Put/Call Ratio) | 情绪指标 | Deribit API | 中 — 机构对冲意愿 |
| 波动率指数(DVOL) | 环境指标 | Deribit API | 中 — 波动率扩张/收缩 |
第二批(需要爬取/计算)
| 信号源 | 类型 | 获取方式 | 预期价值 |
|---|---|---|---|
| Twitter/X情绪 | 情绪指标 | Agent-Reach xsearch | 中 — 散户情绪反指标 |
| 恐贪指数 | 情绪指标 | alternative.me API | 低 — 日级更新太慢 |
| 链上大额转账 | 鲸鱼行为 | Etherscan/Blockchain API | 中 — 鲸鱼动向 |
| 交易所净流入 | 资金流 | CryptoQuant/Glassnode | 高 — 抛压预警 |
第三批(高级)
| 信号源 | 类型 | 获取方式 | 预期价值 |
|---|---|---|---|
| 订单簿深度不对称 | 微观结构 | 币安WS depth | 中 — 支撑/阻力判断 |
| 跨交易所价差 | 套利信号 | 多交易所API | 低 — 实现复杂 |
| 新闻事件检测 | 事件驱动 | LLM分析 | 中 — 黑天鹅预警 |
四、权重优化方法(数据足够后实施)
Phase 1:统计分析(200+笔交易后)
# 按各层分数分桶,看胜率
# 例如:方向层>=40分时胜率65%,<30分时胜率45%
# → 说明方向层有效,保持高权重
# 按拥挤层分桶
# 例如:拥挤层>=15分时胜率60%,<10分时胜率58%
# → 说明拥挤层区分度低,可以降权重Phase 2:回归分析(500+笔交易后)
# 逻辑回归:各层分数 → 是否盈利
# 输出:每个特征的系数 = 最优权重
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_factors, y_win) # X=5层分数, y=盈利/亏损
optimal_weights = model.coef_Phase 3:机器学习(1000+笔交易后)
# XGBoost/随机森林:自动发现非线性关系
# 例如:方向层高+拥挤层低 = 最佳组合(简单线性模型发现不了)
from xgboost import XGBClassifier
model = XGBClassifier()
model.fit(X_factors, y_win)
# 特征重要性排序 → 指导信号源增减五、2026-02-28 开发记录
V5.1完善
- 5层评分真实数据修复:signal_engine之前没正确解析market_indicators的JSONB,拥挤/环境/辅助层全是默认中间分。修了fetch_market_indicators正确解析JSONB → commit
317031a - 前端UI全面压缩:标题改"⚡ 信号引擎 V5.1",所有面板字体/间距/padding缩小 → commits
9382d35,271658c
模拟盘上线(Paper Trading)
- paper_trades表 + signal_engine集成 + 5个API → commit
e054db1 - 开关机制:默认关闭,前端按钮控制,API热更新 → commit
282aed1 - 手续费:Taker 0.05%×2=0.1%来回 → commit
47004ec - 反向信号翻转:持多仓来空信号→先平后开 → commit
6681070 - WebSocket实时TP/SL:独立paper_monitor.py进程,毫秒级平仓 → commit
7b901a2 - 前端aggTrade实时价格:逐笔成交推送 → commit
1d23042 - 当前资金显示 → commit
d0e626a - 冷启动保护:重启后跳过前3轮防重复开仓 → commit
95b45d0 - 5层评分明细记录:score_factors JSONB字段 → commit
022ead6
Bug修复
- arb-api缩进错误 → commit
cd17c76 - Request未导入 → commit
b232270 - useAuth登录检测 → commit
59910fe - 现价不准改币安API → commit
d177d28 - 最新信号symbol参数修复 → commit
404cc68 - 资金字体超框 → commit
95fec35 - gitignore pycache → commit
961cbc6
六、下一步行动
| 阶段 | 时间 | 内容 |
|---|---|---|
| 现在 | 2026-02-28 ~ 03-14 | 模拟盘跑两周,积累200-300笔交易数据 |
| Phase 1 | 03-14 | 统计分析各层贡献,初步调权重 |
| Phase 2 | 03-21 | 加入资金费率+清算数据(第一批新信号源) |
| Phase 3 | 04-01 | 回归分析自动优化权重 |
| Phase 4 | 04-15 | 小仓实盘验证 |
| 持续 | 长期 | 不断加入新信号源,数据驱动迭代 |
七、行业竞品与信号源调研(2026-02-28)
与我们思路相似的项目
1. Hyper-Alpha-Arena(GitHub开源)— 相似度85%
- 地址:https://github.com/HammerGPT/Hyper-Alpha-Arena
- 核心:监控Order Flow + OI变化 + Funding Rate极端值,触发自动交易
- 支持币安合约+Hyperliquid,用LLM(GPT-5/Claude/DeepSeek)做策略决策
- 区别:他们用LLM自然语言描述策略做决策,我们用评分模型
- 我们的优势:5层评分+权重训练更可量化、可回测、可优化
2. FinRL-AlphaSeek(哥伦比亚大学,ACM竞赛)— 相似度80%
- 地址:https://github.com/Open-Finance-Lab/FinRL_Contest_2025
- 论文:https://arxiv.org/html/2504.02281v4
- 核心:因子挖掘(Factor Mining) + 集成学习(Ensemble Learning)
- 两阶段:① 特征工程+因子选择 ② 多模型集成
- 映射关系:他们的"因子"=我们的"信号源",他们的"集成权重"=我们的"评分权重"
- 区别:他们用强化学习(RL)训练Agent,我们用统计回归优化权重
- 可借鉴:遗传算法优化权重(比逻辑回归更强)
3. ACM论文:ML驱动多因子量化模型(ETH市场)— 相似度75%
- 地址:https://dl.acm.org/doi/10.1145/3766918.3766922
- 核心:把交易因子分三类 — 传统技术因子 + 链上因子 + ML生成因子
- 用IC值(信息系数)衡量每个因子的预测力
- 用遗传算法自动优化因子权重
- 信号用Z-score阈值触发(>1买入,<-1卖出)
- 启发:我们也可以用IC值来量化每个信号源的贡献
4. CoinGlass CDRI(衍生品风险指数)— 相似度70%
- 地址:https://www.coinglass.com/pro/i/CDRI
- 核心:综合OI/FR/清算/CVD等多指标打分,评分>80或<20触发信号
- 区别:他们只做风险预警展示,不做自动交易
行业信号源使用频率排名
| 排名 | 信号源 | 行业使用频率 | 我们状态 | 数据源 | 获取难度 |
|---|---|---|---|---|---|
| 1 | CVD/Order Flow | ⭐⭐⭐⭐⭐ | ✅ 已有 | agg_trades | - |
| 2 | Open Interest | ⭐⭐⭐⭐⭐ | ✅ 已有 | 币安API | - |
| 3 | Funding Rate | ⭐⭐⭐⭐⭐ | ⬜ 待加 | 币安API(免费) | ⭐ |
| 4 | 清算数据 | ⭐⭐⭐⭐ | ⬜ 待加 | 币安WS forceOrder | ⭐⭐ |
| 5 | 多空比 | ⭐⭐⭐⭐ | ✅ 已有 | 币安API | - |
| 6 | 链上净流入/流出 | ⭐⭐⭐⭐ | ⬜ 待加 | CryptoQuant(付费) | ⭐⭐⭐ |
| 7 | Coinbase Premium | ⭐⭐⭐ | ✅ 已有 | 价差计算 | - |
| 8 | 社交情绪 | ⭐⭐⭐ | ⬜ 待加 | Santiment/LLM | ⭐⭐⭐ |
| 9 | 期权PCR/DVOL | ⭐⭐⭐ | ⬜ 待加 | Deribit API | ⭐⭐ |
| 10 | 鲸鱼钱包追踪 | ⭐⭐⭐ | ⬜ 待加 | Nansen(付费) | ⭐⭐⭐ |
| 11 | 清算热力图 | ⭐⭐ | ⬜ 待加 | CoinGlass API(付费) | ⭐⭐ |
| 12 | 订单簿深度 | ⭐⭐ | ⬜ 待加 | 币安WS depth | ⭐⭐ |
关键结论
- 没有人做得和我们完全一样 — 大多数用传统技术指标或纯ML黑箱,用CVD+多空比+OI做多层评分的几乎没有
- 行业趋势明确 — 多因子 + ML权重优化,和范总定的方向完全一致
- Funding Rate是最高优先级 — 行业使用率最高、免费获取、我们还没加
- 权重优化可升级 — 从逻辑回归→IC值+遗传算法,参考ACM论文方法
数据供应商参考
| 平台 | 核心能力 | 价格 | 适合 |
|---|---|---|---|
| CoinGlass | 衍生品数据(OI/FR/清算/热力图) | 免费基础+付费API | 清算数据 |
| CryptoQuant | 链上数据(净流入/矿工/交易所储备) | $29/月起 | 链上因子 |
| Santiment | 社交情绪+链上+开发活跃度 | 免费基础+付费 | 情绪因子 |
| Glassnode | 链上高级指标(SOPR/NUPL/STH-LTH) | $39/月起 | 深度链上 |
| Nansen | 鲸鱼钱包追踪+Smart Money | $100/月起 | 鲸鱼行为 |