返回因子超市

通用量化因子

158 因子

白金 会员可用

在 Alpha 101 基础上扩展的 158 因子库

API 接入

查询 Alpha 158 因子(159 个 qlib 标准技术因子,60 分钟级,后复权)。按 symbol 切片分页返回。

GET/api/v1/factors/alpha158/queryHeader 必带 X-API-Key

响应示例(真实数据)

{
  "code": "SUCCESS",
  "data": {
    "items": [
      {
        "symbol": "sh600519",
        "datetime": "2026-05-28T15:00:00",
        "factors": {
          "KMID":  -0.0000078,  "KLEN":  0.0063950,  "KMID2": -0.0012254,
          "KUP":   0.0024843,   "KUP2":  0.3884804,  "KLOW":  0.0039028,
          "OPEN0": 1.0000079,   "HIGH0": 1.0024922,  "LOW0":  0.9960971,
          "ROC5":  1.0235662,   "ROC10": 0.9980877,  "MA5":   1.0076568,
          "STD5":  0.0086937,   "BETA5": 0.0212345,  "MAX5":  1.0190234
          // ... 共 159 个因子,覆盖 K 线形态 / ROC / MA / STD / BETA / RSV / CORR / VMA 等
        }
      }
    ],
    "factor_names": ["KMID", "KLEN", "...", "VSUMD60"],
    "pagination": {"page": 1, "page_size": 1, "total": 2316, "total_pages": 2316}
  },
  "message": "查询成功"
}

查询参数

参数类型必填说明
symbolsh600519 / 600519.SH必填股票代码,自动归一化
startYYYY-MM-DD可选起始日期(含端点)
endYYYY-MM-DD可选结束日期(不含端点)
pageint (默认 1)可选分页页码
page_sizeint (默认 500, 最大 5000)可选每页条数;159 列宽,建议 ≤1000

调用示例(curl)

curl -G 'https://deepemerge.cn/api/v1/factors/alpha158/query' \
  -H 'X-API-Key: <你的密钥>' \
  --data-urlencode 'symbol=sh600519' \
  --data-urlencode 'start=2026-01-01' \
  --data-urlencode 'page_size=1000'

响应字段

字段说明
items[].symbol归一化后股票代码
items[].datetimeK 线时间(北京时间)
items[].factors{KMID: v, KLEN: v, ..., VSUMD60: v} 共 159 项;预热期可能为 NaN/null
data.factor_names本接口所有因子名(按数组顺序),用于客户端自描述
pagination{page, page_size, total, total_pages}

159 列宽表,单 response 大约 250 KB / 1000 条;建议按时间窗口分批。

没有 API Key?扫码加企微客服开通

数据规格

覆盖标的

全市场 A 股

更新频率

T-2

所需会员

白金 及以上

因子介绍

在 Alpha 101 基础上扩展构造的 158 因子库,包含更细粒度的量价、动量、波动率类特征,可与 101 因子混合使用。

推荐用法

多因子模型扩展集合、风险模型构建

完整说明文档

Alpha158 因子说明文档

Qlib 标准因子集 — 158 个系统化量价因子

一、背景与起源

Alpha158 是微软 Qlib 平台内置的标准量化因子集,包含 158 个基于日频 OHLCV 数据(开盘价、最高价、最低价、收盘价、成交量、成交额)的量价因子。Alpha158 的设计定位是"开箱即用的因子工具箱"——它覆盖了从 K 线形态、趋势、波动率、成交量到价量相关性的几乎所有常见技术分析维度,为机器学习选股模型提供标准化的输入特征。

在本系统中,自动生成全部 158 个因子,配置了 5 个滚动窗口(5、10、20、30、60 日)的统计特征,最终输出 159 维因子向量。与 Alpha101 侧重"逻辑表达式"不同,Alpha158 更侧重"系统化的技术指标提取"——它本质上是一个标准化的特征工程管道。

二、因子分类体系

2.1 K 线形态因子(KBar 类)

描述单根 K 线的形态特征,将 OHLC 之间的结构关系量化为数值指标:

因子 计算公式 技术含义
KMID (Close - Open) / Open 实体相对涨幅,正值为阳线,负值为阴线
KLEN (High - Low) / Open 振幅(相对开盘价),衡量价格波动范围
KMID2 (Close - Open) / (High - Low + ε) 实体占波动范围的比例。接近 ±1 = 光头光脚,接近 0 = 十字星
KUP (High - max(Open, Close)) / Open 上影线占比,衡量上方抛压
KUP2 (High - max(Open, Close)) / (High - Low + ε) 标准化上影线,与振幅无关的纯形态指标
KLOW (min(Open, Close) - Low) / Open 下影线占比,衡量下方承接力度
KSFT 价格偏移量 前一周期价格的相对变化量

2.2 滚动窗口因子(Rolling 类)

对价格和成交量序列进行滚动窗口统计,多尺度捕捉市场特征。本系统配置了 5 个窗口(5、10、20、30、60 日),每个窗口计算以下统计量:

统计量 说明 Alpha 含义
均值 (Mean) 窗口内价格的平均值 短均线上穿长均线 = 金叉(看涨)
标准差 (Std) 窗口内价格的波动幅度 高波动 = 风险大但机会也多
最大值/最小值 窗口内的极限价位 突破 N 日新高/新低是重要技术信号
偏度 (Skew) 价格分布的不对称性 正偏 = 缓涨急跌,负偏 = 急涨缓跌
峰度 (Kurt) 分布的肥尾程度 高峰度 = 极端行情频繁
分位数 排序位置统计 当前价位在历史上的相对高低位置
相关性 (Corr) 价格与成交量的关联 量价正相关 = 趋势确认,负相关 = 背离
线性回归 趋势线的斜率和 R² 量化趋势的强度和可信度

2.3 价格与成交量基础特征(Price & Volume 类)

直接使用当日开盘价、最高价、最低价、VWAP 等价格特征,以及当日成交量及其与其他周期均量的比值。其中 VWAP(成交量加权均价)是关键特征——它代表了市场参与者的"平均成本",价格相对于 VWAP 的位置有重要的博弈意义。

三、与 Alpha101 的对比

维度 Alpha101 Alpha158
起源 WorldQuant 2015 年论文 微软 Qlib 平台内置
因子数量(本系统) 82 个 159 个
设计理念 公式化 Alpha 表达式,每个因子表达一个独立的投资逻辑 系统化特征工程,对价格序列做多窗口多统计量的标准化提取
计算复杂度 高(复杂表达式、大量嵌套函数) 中(主要是滚动窗口统计)
可解释性 高(每个公式有明确的投资含义) 中(统计特征需要结合技术分析解读)
窗口设置 各因子内部硬编码 统一 5 窗口(5/10/20/30/60 日)
特色 量价背离、均值回归等精细逻辑 K 线形态、多尺度趋势覆盖全面
典型因子示例 #002: 量价背离检测 MA5, STD20, CORR30

四、技术实现

Alpha158 因子的生成同样基于 KunQuant 库,采用了模块化的构建方式:

  • 数据输入:通过 Alpha158.AllData 封装 OHLCV 六维数据
  • 因子构建:调用 .build() 方法,配置 kbar(K线形态)、price(价格特征)、volume(成交量特征)、rolling(滚动窗口统计)四个模块
  • 滚动窗口:配置 5/10/20/30/60 五个窗口,覆盖短期到中期的时间尺度
  • 输出优化:使用 Double 精度(float64)计算,blocking_len=4 对应 AVX2 向量化指令加速
  • JIT 编译:与 Alpha101 共用 KunRunner 执行引擎,支持多线程并行

五、因子应用场景

  • 趋势策略:利用 MA 多空排列、ROC 动量变化捕捉方向性机会
  • 突破策略:利用 Donchian 通道(最高最低价)识别突破形态
  • 均值回归:利用标准差偏离度、BIAS 乖离率寻找过度延伸后的回归机会
  • 成交量策略:利用量比、换手率、VWAP 判断资金参与深度
  • 机器学习特征:作为 LightGBM / XGBoost / 深度学习模型的标准化输入特征

六、注意事项

**因子冗余:**约 30% 的因子 IC 均值接近 0,且部分多窗口因子(如 MA5/MA10/MA20)高度共线性,建议在使用前进行 IC 筛选、相关性过滤或 PCA 降维。

**归一化要求:**Alpha158 的原始因子值量纲差异极大(价格 vs 成交量 vs 比例),必须在输入模型前进行 Z-score 标准化或 RobustZScore 归一化。

**行业市值中性化:**与 Alpha101 相同,原始 Alpha158 因子可能包含行业和市值风格偏倚,需在中性化管道中统一处理。

**因子衰减:**技术因子的有效性会随市场环境变化而衰减。建议每季度进行因子 IC 评估,淘汰失效因子、纳入新因子,保持因子池的活力。