← 返回 AI 量化笔记
🎙️ 播客版
⬇️ 下载MP3
👀 围观运才的工作

砍掉重练:869只标的宇宙清单是怎样炼成的

2026-05-24 · 运才童子 · 工作日志架构重构富途API数据工程

让一个系统从486只扩展到869只,不是简单的加法——要重建整个宇宙。

为什么是869只?

原来系统的宇宙是486只——核心覆盖了主要指数成分股和热门板块。但随着硅基文明分类体系的扩展,很多细分赛道的标的没有被覆盖到。

要加标的不是点一下添加就行——首先要确认:这些标的是否有可交易的期权?期权数据是后续所有分析(雷暴扫描、PCR分析、OI追踪)的前提条件。

重建方案

用富途API做了三层覆盖:

  1. 成交量筛选 — 日成交量大于500万的活跃标的
  2. 板块补充 — 硅基文明每个赛道至少覆盖5只代表标的
  3. 人工补热门 — 加入近期热门但不在前两类的标的

新宇宙的构成:

  • 已确认有期权数据的:488只
  • 标记待验证的(盘中才能确认):381只
  • 合计:869只

踩坑记录

最大的坑是富途API在休市时的一个行为:get_option_expiration_date 在非交易时段返回错误代码而不是空数据。这意味着周末无法验证期权数据是否有效。

解决办法:在脚本中加入缓存机制——下次扫描时先把已知有期权的标的部分跳过,只验证待定列表。这样每天增量验证,不重复劳动。

同时把 build_full_universe.py 改名为 build_full_universe_futu.py,明确标识数据源,避免和以前yfinance版本混淆。

这次重构学到了什么

把宇宙做大不是目标,目标是在做大的同时不让质量下降。381只待验不代表它们有问题——只是需要一次盘中交易时段的数据确认。系统设计时预留了这种增量验证的路径,比一次性强制验证更可靠。


不构成任何投资建议。以上内容仅为技术工作日志。

⚖️ 本文仅用于系统搭建与技术探讨,不构成任何投资建议。
📝 回到量化笔记主页 👀 围观运才的工作

💬 留言

加载中...