darkeril

V5.2 策略进化路线图

信号引擎V5.2 — 数据驱动的策略迭代框架,将信号源视为特征、权重视为模型参数,通过模拟盘持续优化

V5.2 策略进化路线图

优先级:P0(最高) | 负责人:露露 | 创建:2026-02-28


一、核心思路 ⭐⭐⭐

信号源 = 特征(Feature)

每一个数据源都是模型的一个输入特征。特征越多、越有效,模型的预测能力越强。

当前V5.1的5层评分体系,本质上就是一个手动设计的线性模型

总分 = W1×方向层 + W2×拥挤层 + W3×环境层 + W4×确认层 + W5×辅助层

权重 = 模型参数(Parameter)

当前权重是人工拍的(45/20/15/15/5),不一定是最优的。

目标:用真实交易数据(模拟盘+实盘),自动学习每个特征的最优权重。

迭代循环(正向飞轮)

┌─────────────────────────────────────────────┐
│                                             │
│  ① 加入新信号源(特征)                      │
│       ↓                                     │
│  ② 模拟盘跑数据(每笔记录5层分数+盈亏)       │
│       ↓                                     │
│  ③ 分析数据(哪些特征有效、最优权重)          │
│       ↓                                     │
│  ④ 调整权重 / 加减特征                       │
│       ↓                                     │
│  ⑤ 实盘验证                                 │
│       ↓                                     │
│  ⑥ 数据反馈 → 回到①                         │
│                                             │
│  数据越多 → 模型越准 → 赚越多 → 数据越多      │
│                                             │
└─────────────────────────────────────────────┘

这就是量化交易的核心方法论,和大模型训练思路一样:

  • 大模型:数据 → 特征提取 → 权重训练 → 验证 → 迭代
  • 信号引擎:行情数据 → 信号源/指标 → 评分权重 → 模拟盘验证 → 调参迭代

护城河:积累的数据和调优后的参数,是别人无法复制的。


二、当前架构(V5.1)

已有信号源(特征)

权重信号源数据来源状态
方向层45分CVD_fast(30m)agg_trades计算✅ 真实数据
方向层-CVD_mid(4h)agg_trades计算✅ 真实数据
方向层-P99大单流agg_trades计算✅ 真实数据
方向层+5CVD加速度agg_trades计算✅ 真实数据
拥挤层20分多空比币安API globalLongShortAccountRatio✅ 真实数据
拥挤层-大户持仓比币安API topLongShortAccountRatio✅ 真实数据
环境层15分OI变化率币安API openInterestHist✅ 真实数据
确认层15分多时间框架CVD一致性agg_trades计算✅ 真实数据
辅助层5分Coinbase Premium币安+CB价差✅ 真实数据

每笔交易记录的数据

{
  "score": 85,
  "score_factors": {
    "direction": {"score": 45, "cvd_fast": 15, "cvd_mid": 15, "p99_flow": 15, "accel_bonus": 5},
    "crowding": {"score": 15, "long_short_ratio": 10, "top_trader_position": 5},
    "environment": {"score": 10, "open_interest_hist": 0.02},
    "confirmation": {"score": 15},
    "auxiliary": {"score": 5, "coinbase_premium": 0.0012}
  },
  "pnl_r": 2.25,
  "status": "tp"
}

三、V5.2 待加入信号源(按优先级)

第一批(数据容易获取)

信号源类型获取方式预期价值
资金费率(Funding Rate)拥挤指标币安API /fapi/v1/fundingRate高 — 极端FR是反转信号
清算数据(Liquidation)情绪指标币安WS forceOrder高 — 大额清算=趋势加速
期权PCR(Put/Call Ratio)情绪指标Deribit API中 — 机构对冲意愿
波动率指数(DVOL)环境指标Deribit API中 — 波动率扩张/收缩

第二批(需要爬取/计算)

信号源类型获取方式预期价值
Twitter/X情绪情绪指标Agent-Reach xsearch中 — 散户情绪反指标
恐贪指数情绪指标alternative.me API低 — 日级更新太慢
链上大额转账鲸鱼行为Etherscan/Blockchain API中 — 鲸鱼动向
交易所净流入资金流CryptoQuant/Glassnode高 — 抛压预警

第三批(高级)

信号源类型获取方式预期价值
订单簿深度不对称微观结构币安WS depth中 — 支撑/阻力判断
跨交易所价差套利信号多交易所API低 — 实现复杂
新闻事件检测事件驱动LLM分析中 — 黑天鹅预警

四、权重优化方法(数据足够后实施)

Phase 1:统计分析(200+笔交易后)

# 按各层分数分桶,看胜率
# 例如:方向层>=40分时胜率65%,<30分时胜率45%
# → 说明方向层有效,保持高权重

# 按拥挤层分桶
# 例如:拥挤层>=15分时胜率60%,<10分时胜率58%
# → 说明拥挤层区分度低,可以降权重

Phase 2:回归分析(500+笔交易后)

# 逻辑回归:各层分数 → 是否盈利
# 输出:每个特征的系数 = 最优权重
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_factors, y_win)  # X=5层分数, y=盈利/亏损
optimal_weights = model.coef_

Phase 3:机器学习(1000+笔交易后)

# XGBoost/随机森林:自动发现非线性关系
# 例如:方向层高+拥挤层低 = 最佳组合(简单线性模型发现不了)
from xgboost import XGBClassifier
model = XGBClassifier()
model.fit(X_factors, y_win)
# 特征重要性排序 → 指导信号源增减

五、2026-02-28 开发记录

V5.1完善

  • 5层评分真实数据修复:signal_engine之前没正确解析market_indicators的JSONB,拥挤/环境/辅助层全是默认中间分。修了fetch_market_indicators正确解析JSONB → commit 317031a
  • 前端UI全面压缩:标题改"⚡ 信号引擎 V5.1",所有面板字体/间距/padding缩小 → commits 9382d35, 271658c

模拟盘上线(Paper Trading)

  • paper_trades表 + signal_engine集成 + 5个API → commit e054db1
  • 开关机制:默认关闭,前端按钮控制,API热更新 → commit 282aed1
  • 手续费:Taker 0.05%×2=0.1%来回 → commit 47004ec
  • 反向信号翻转:持多仓来空信号→先平后开 → commit 6681070
  • WebSocket实时TP/SL:独立paper_monitor.py进程,毫秒级平仓 → commit 7b901a2
  • 前端aggTrade实时价格:逐笔成交推送 → commit 1d23042
  • 当前资金显示 → commit d0e626a
  • 冷启动保护:重启后跳过前3轮防重复开仓 → commit 95b45d0
  • 5层评分明细记录:score_factors JSONB字段 → commit 022ead6

Bug修复

  • arb-api缩进错误 → commit cd17c76
  • Request未导入 → commit b232270
  • useAuth登录检测 → commit 59910fe
  • 现价不准改币安API → commit d177d28
  • 最新信号symbol参数修复 → commit 404cc68
  • 资金字体超框 → commit 95fec35
  • gitignore pycache → commit 961cbc6

六、下一步行动

阶段时间内容
现在2026-02-28 ~ 03-14模拟盘跑两周,积累200-300笔交易数据
Phase 103-14统计分析各层贡献,初步调权重
Phase 203-21加入资金费率+清算数据(第一批新信号源)
Phase 304-01回归分析自动优化权重
Phase 404-15小仓实盘验证
持续长期不断加入新信号源,数据驱动迭代

七、行业竞品与信号源调研(2026-02-28)

与我们思路相似的项目

1. Hyper-Alpha-Arena(GitHub开源)— 相似度85%

  • 地址https://github.com/HammerGPT/Hyper-Alpha-Arena
  • 核心:监控Order Flow + OI变化 + Funding Rate极端值,触发自动交易
  • 支持币安合约+Hyperliquid,用LLM(GPT-5/Claude/DeepSeek)做策略决策
  • 区别:他们用LLM自然语言描述策略做决策,我们用评分模型
  • 我们的优势:5层评分+权重训练更可量化、可回测、可优化

2. FinRL-AlphaSeek(哥伦比亚大学,ACM竞赛)— 相似度80%

  • 地址https://github.com/Open-Finance-Lab/FinRL_Contest_2025
  • 论文https://arxiv.org/html/2504.02281v4
  • 核心:因子挖掘(Factor Mining) + 集成学习(Ensemble Learning)
  • 两阶段:① 特征工程+因子选择 ② 多模型集成
  • 映射关系:他们的"因子"=我们的"信号源",他们的"集成权重"=我们的"评分权重"
  • 区别:他们用强化学习(RL)训练Agent,我们用统计回归优化权重
  • 可借鉴:遗传算法优化权重(比逻辑回归更强)

3. ACM论文:ML驱动多因子量化模型(ETH市场)— 相似度75%

  • 地址https://dl.acm.org/doi/10.1145/3766918.3766922
  • 核心:把交易因子分三类 — 传统技术因子 + 链上因子 + ML生成因子
  • 用IC值(信息系数)衡量每个因子的预测力
  • 遗传算法自动优化因子权重
  • 信号用Z-score阈值触发(>1买入,<-1卖出)
  • 启发:我们也可以用IC值来量化每个信号源的贡献

4. CoinGlass CDRI(衍生品风险指数)— 相似度70%

  • 地址https://www.coinglass.com/pro/i/CDRI
  • 核心:综合OI/FR/清算/CVD等多指标打分,评分>80或<20触发信号
  • 区别:他们只做风险预警展示,不做自动交易

行业信号源使用频率排名

排名信号源行业使用频率我们状态数据源获取难度
1CVD/Order Flow⭐⭐⭐⭐⭐✅ 已有agg_trades-
2Open Interest⭐⭐⭐⭐⭐✅ 已有币安API-
3Funding Rate⭐⭐⭐⭐⭐⬜ 待加币安API(免费)
4清算数据⭐⭐⭐⭐⬜ 待加币安WS forceOrder⭐⭐
5多空比⭐⭐⭐⭐✅ 已有币安API-
6链上净流入/流出⭐⭐⭐⭐⬜ 待加CryptoQuant(付费)⭐⭐⭐
7Coinbase Premium⭐⭐⭐✅ 已有价差计算-
8社交情绪⭐⭐⭐⬜ 待加Santiment/LLM⭐⭐⭐
9期权PCR/DVOL⭐⭐⭐⬜ 待加Deribit API⭐⭐
10鲸鱼钱包追踪⭐⭐⭐⬜ 待加Nansen(付费)⭐⭐⭐
11清算热力图⭐⭐⬜ 待加CoinGlass API(付费)⭐⭐
12订单簿深度⭐⭐⬜ 待加币安WS depth⭐⭐

关键结论

  1. 没有人做得和我们完全一样 — 大多数用传统技术指标或纯ML黑箱,用CVD+多空比+OI做多层评分的几乎没有
  2. 行业趋势明确 — 多因子 + ML权重优化,和范总定的方向完全一致
  3. Funding Rate是最高优先级 — 行业使用率最高、免费获取、我们还没加
  4. 权重优化可升级 — 从逻辑回归→IC值+遗传算法,参考ACM论文方法

数据供应商参考

平台核心能力价格适合
CoinGlass衍生品数据(OI/FR/清算/热力图)免费基础+付费API清算数据
CryptoQuant链上数据(净流入/矿工/交易所储备)$29/月起链上因子
Santiment社交情绪+链上+开发活跃度免费基础+付费情绪因子
Glassnode链上高级指标(SOPR/NUPL/STH-LTH)$39/月起深度链上
Nansen鲸鱼钱包追踪+Smart Money$100/月起鲸鱼行为

On this page