返回因子超市

深度衍智大模型因子

大模型量价因子

白金 会员可用

基于大模型从量价数据中蒸馏的衍生因子

API 接入

查询大模型量价因子(26 个因子,60 分钟级,后复权)。按 symbol 切片,时间范围内分页返回。

GET/api/v1/factors/volumePrice/queryHeader 必带 X-API-Key

响应示例(真实数据)

{
  "code": "SUCCESS",
  "data": {
    "items": [
      {
        "symbol": "sz000400",
        "datetime": "2013-07-15T14:00:00",
        "overnight_gap": -0.009669891,
        "efficiency_ratio": 0.014651214,
        "lin_reg_slope": -0.00020518457,
        "lin_reg_r2": 0.023341602,
        "bias_128": 0.07879423,
        "donchian_pos": 0.8723898,
        "price_accel": 0.034565773,
        "vol_parkinson": 0.016681362,
        "pv_corr": 0.6288479,
        "rvol": 0.7353656,
        "amihud_illiq": 0.020750202,
        "vwap_dev_24": 0.044359364
        // ... 共 26 个因子
      }
    ],
    "pagination": {"page": 1, "page_size": 1, "total": 495, "total_pages": 495}
  },
  "message": "查询成功"
}

查询参数

参数类型必填说明
symbolsh600519 / 600519.SH必填股票代码,自动归一化
startYYYY-MM-DD可选起始日期(含端点)
endYYYY-MM-DD可选结束日期(不含端点)
pageint (默认 1)可选分页页码
page_sizeint (默认 500, 最大 5000)可选每页条数

调用示例(curl)

curl -G 'https://deepemerge.cn/api/v1/factors/volumePrice/query' \
  -H 'X-API-Key: <你的密钥>' \
  --data-urlencode 'symbol=sh600519' \
  --data-urlencode 'start=2026-01-01' \
  --data-urlencode 'page_size=2000'

响应字段

字段说明
items[].symbol归一化后股票代码
items[].datetimeK 线时间(北京时间)
items[].overnight_gap, efficiency_ratio, ...26 个量价因子,全部为 double precision;预热期允许 NULL
pagination{page, page_size, total, total_pages}

单股全市场 7 年约 6 万条 60 分钟 K 线,建议按时间窗口拉取,避免一次性请求过大。

没有 API Key?扫码加企微客服开通

数据规格

覆盖标的

全市场 A 股

更新频率

T-2

所需会员

白金 及以上

因子介绍

利用大模型从量价数据中蒸馏的衍生因子集合,捕捉短期市场结构变化。相较于人工构造的量价因子,能从原始量价中提取更高阶的非线性特征。

推荐用法

与 101 / 158 因子组合使用,强化短期信号

完整说明文档

量价大模型因子说明文档

基于高频数据与市场微观结构的 26 个技术因子 V3.0

一、因子概述

量价大模型因子是一套自主开发的高频量价技术因子集(V3.0),共包含 26 个因子,基于股票的分钟级 OHLCV(开盘价、最高价、最低价、收盘价、成交量、成交额)数据计算。因子的核心理念是:市场微观结构(如日内走势形态、资金流向、成本分布、波动率聚集等)包含了丰富的 Alpha 信息,这些信息在日频数据中往往被"平均化"而丢失。

因子涵盖七大类别:隔夜情绪、动量与趋势、波动率与结构、成交量与微观结构、高阶矩、日内强度、成本与流动性分析。短周期参数(24 个 K 线)捕捉近期微观变化,长周期参数(128 个 K 线)捕捉中期趋势特征。

二、因子分类详解

2.1 隔夜情绪因子(1 个)

编号 因子名称 描述 Alpha 逻辑
1 overnight_gap(隔夜跳空力度) 当日开盘价 / 昨日收盘价 - 1,仅保留当日首根 K 线并向前填充 隔夜信息(政策、外盘、公告)的集中释放,跳空力度反映市场对信息的定价强度。正向跳空预示强势,负向跳空临近支撑位则蕴含均值回归机会

2.2 动量与趋势因子(5 个)

编号 因子名称 描述 Alpha 逻辑
2 efficiency_ratio(趋势效率系数) |Close - Close_N| / Sum(|ΔClose|), N=128 衡量价格运动的"方向纯净度"。效率系数高=流畅趋势,效率系数低=震荡行情。用来过滤趋势策略的信号质量
3 lin_reg_slope(线性回归斜率) 128 周期滚动线性回归斜率,除以价格标准化 量化"涨跌速度"。正值且越大=加速上涨;负值且越小=加速下跌。标准化后使不同价位股票可比
4 lin_reg_r2(趋势拟合度) 128 周期滚动线性回归的 R² 衡量趋势的可信度。R² 接近 1 = 高度线性趋势(确定性高);R² 接近 0 = 随机游走(噪声为主)
5 bias_128(乖离率) (Close - MA_128) / MA_128 价格相对长期均线的偏离程度。负乖离过大=超卖,正乖离过大=超买。经典的均值回归指标
6 donchian_pos(价格位置) (Close - Low_128) / (High_128 - Low_128) 价格在 128 周期范围内的相对位置。0=最低点,1=最高点。结合趋势判断可用于突破或反转策略

2.3 价格加速度因子(1 个)

编号 因子名称 描述 Alpha 逻辑
7 price_accel(价格加速度) (V_current - V_previous),其中 V = 3周期涨跌幅 动量变化的速率。正加速度=趋势加速(顺势),负加速度=趋势减弱(可能反转)。比单纯动量更早捕捉拐点

2.4 波动率与结构因子(3 个)

编号 因子名称 描述 Alpha 逻辑
8 vol_parkinson(帕金森波动率) sqrt(Mean(ln(H/L)²) / (4·ln(2))), N=128 仅用最高最低价估算波动率,比收盘价标准差更高效。高波动=不确定性大,低波动=酝酿突破
9 shadow_upper_ratio(上影线压力) 24周期上影线总和 / 24周期振幅总和 上方抛压的量化指标。上影线占比高=多头尝试上攻但被空头压制,短期看跌信号
10 shadow_lower_ratio(下影线支撑) 24周期下影线总和 / 24周期振幅总和 下方买盘的量化指标。下影线占比高=空头打压但被多头承接,短期看涨信号

2.5 真实波幅因子(1 个)

编号 因子名称 描述 Alpha 逻辑
11 natr(归一化真实波幅) 24周期 ATR / Close 波动率相对当前价格的百分比。使不同价位股票的波动率可比,用于仓位管理和止损设置

2.6 成交量与微观结构因子(5 个)

编号 因子名称 描述 Alpha 逻辑
12 pv_corr(量价相关性) 24周期 Close 与 Vol 的相关系数 量价同步=趋势确认;量价背离=趋势存疑。经典技术分析中"量价配合"的量化版本
13 rvol(相对成交量) Vol / MA_128(Vol) 当前成交量相对历史均值的高低。>1.5=放量(关注度高),<0.5=缩量(无人问津)
14 money_flow_norm(标准化资金流向) 24周期 CLV×Vol 均值 / 24周期 Vol 均值 基于"量在价先"原则的资金净流向。正值=资金净流入(价格在上部运行),负值=资金净流出
15 amihud_illiq(Amihud 非流动性) |收益率| / 成交额 的 128 周期均值 × 10⁸ 衡量"单位成交额对价格的影响"。数值越大=流动性越差,买卖冲击成本越高。对机构资金有重要参考
16 vol_std_ratio(成交量波动率比) 128周期 Vol 标准差 / 128周期 Vol 均值 成交量本身的波动程度。异动增加=资金面分歧加大,往往是行情变化的先行指标

2.7 整数关口因子(1 个)

编号 因子名称 描述 Alpha 逻辑
17 barrier_dist(整数关口距离) |Close - Round(Close)| / Close 价格距离最近整数的相对距离。价格在整数关口附近存在"磁吸效应"和"突破效应",是行为金融学的应用

2.8 高阶矩因子(3 个)

编号 因子名称 描述 Alpha 逻辑
18 skew(偏度) 128周期收益率的偏度 收益分布的不对称性。正偏=大涨多小跌少(慢牛),负偏=大跌多小涨少(急跌)。负偏度反转常蕴含机会
19 kurt(峰度) 128周期收益率的峰度 收益分布的"肥尾"程度。高峰度=极端行情频发,低峰度=平稳运行。用于尾部风险预警
20 downside_vol_ratio(下行风险占比) 下行标准差 / 总标准差, N=128 波动的不对称性。>0.5=下跌波动贡献更大(偏空信号),<0.5=上涨波动贡献更大

2.9 日内强度因子(1 个)

编号 因子名称 描述 Alpha 逻辑
21 intraday_intensity(日内强度) (Close - Open) / (High - Low) 日内多空博弈的结果。-1=最低价收盘(空方完胜),+1=最高价收盘(多方完胜)。反映日内主导力量

2.10 成本与流动性因子(5 个)

编号 因子名称 描述 Alpha 逻辑
22 vwap_dev_24(短期成本偏离) (Close - VWAP_24) / VWAP_24 价格相对于 24 周期成交量加权均价(市场平均成本)的偏离。高于 VWAP=大多数持有者浮盈,低于 VWAP=浮亏。是核心因子
23 vwap_dev_128(长期成本偏离) (Close - VWAP_128) / VWAP_128 同上但更长周期,反映中期成本结构
24 vwap_zscore_24(成本穿透力) (Close - VWAP_24) / Std(Close, 24) 将成本偏离用波动率标准化,衡量偏离的"统计显著性"。|Z|>2=显著偏离成本区,可能有回归动力
25 vwap_slope_24(成本趋势) VWAP_24 的滚动线性回归斜率 市场平均成本的移动方向。成本上升=资金持续流入推高(看涨),成本下降=资金流出
26 price_cost_div(量价背离) Close 的 24周期涨跌幅 - VWAP_24 的 24周期涨跌幅 价格变化与成本变化的差。价格上涨但成本未跟=虚涨(可能回落),价格下跌成本不降=假跌

三、技术实现

因子采用全向量化计算,核心优化包括:

  • 数据读取:np.load() 直接加载预处理的 .npy 文件,I/O 效率优于 CSV
  • 滚动计算:利用 Pandas rolling 窗口进行向量化统计,避免 Python 循环
  • 并行处理:使用 ProcessPoolExecutor 多进程并行,自动利用全部 CPU 核心
  • 内存优化:计算过程使用 float64 精度,存储转换为 float32 以节省空间
  • 成交量复权:通过 amount / avg_price 反推真实成交量,解决复权因子导致的数据失真问题

输入数据为分钟级高质量复权数据,输出时仅保留每日 14:00 时刻的因子快照,既保证了因子质量又控制了数据存储规模。

四、因子应用场景

  • 日内择时策略:利用 overnight_gap 捕捉隔夜信息驱动的开盘机会
  • 趋势跟踪策略:利用 efficiency_ratio、lin_reg_slope 识别流畅趋势行情
  • 均值回归策略:利用 bias_128、vwap_zscore_24 捕捉极端偏离后的回归机会
  • 成交量分析:利用 pv_corr、money_flow_norm、rvol 判断资金动向和参与热度
  • 风险预警:利用 skew、kurt、downside_vol_ratio 监测非对称尾部风险

五、版本迭代说明

因子V3.0 相比前两代的核心改进:

  • 成交量复权方案优化:用 (O+H+L+C)/4 替代 (H+L+C)/3 计算日内均价,信息利用率提升
  • 引入 VWAP 成本分析体系:新增 5 个 VWAP 相关因子,覆盖成本偏离、穿透力、趋势和背离
  • 增加高阶矩特征:偏度、峰度、下行波动率占比,捕捉收益分布的非线性特征
  • 加速度因子优化:用 3 周期速度差替代简单的二阶差分,更符合物理直觉
  • 整数关口距离:引入行为金融学视角,量化价格在关键心理价位的微观行为