通用量化因子
在 Alpha 101 基础上扩展的 158 因子库
查询 Alpha 158 因子(159 个 qlib 标准技术因子,60 分钟级,后复权)。按 symbol 切片分页返回。
/api/v1/factors/alpha158/queryHeader 必带 X-API-Key响应示例(真实数据)
{
"code": "SUCCESS",
"data": {
"items": [
{
"symbol": "sh600519",
"datetime": "2026-05-28T15:00:00",
"factors": {
"KMID": -0.0000078, "KLEN": 0.0063950, "KMID2": -0.0012254,
"KUP": 0.0024843, "KUP2": 0.3884804, "KLOW": 0.0039028,
"OPEN0": 1.0000079, "HIGH0": 1.0024922, "LOW0": 0.9960971,
"ROC5": 1.0235662, "ROC10": 0.9980877, "MA5": 1.0076568,
"STD5": 0.0086937, "BETA5": 0.0212345, "MAX5": 1.0190234
// ... 共 159 个因子,覆盖 K 线形态 / ROC / MA / STD / BETA / RSV / CORR / VMA 等
}
}
],
"factor_names": ["KMID", "KLEN", "...", "VSUMD60"],
"pagination": {"page": 1, "page_size": 1, "total": 2316, "total_pages": 2316}
},
"message": "查询成功"
}查询参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| symbol | sh600519 / 600519.SH | 必填 | 股票代码,自动归一化 |
| start | YYYY-MM-DD | 可选 | 起始日期(含端点) |
| end | YYYY-MM-DD | 可选 | 结束日期(不含端点) |
| page | int (默认 1) | 可选 | 分页页码 |
| page_size | int (默认 500, 最大 5000) | 可选 | 每页条数;159 列宽,建议 ≤1000 |
调用示例(curl)
curl -G 'https://deepemerge.cn/api/v1/factors/alpha158/query' \
-H 'X-API-Key: <你的密钥>' \
--data-urlencode 'symbol=sh600519' \
--data-urlencode 'start=2026-01-01' \
--data-urlencode 'page_size=1000'响应字段
| 字段 | 说明 |
|---|---|
| items[].symbol | 归一化后股票代码 |
| items[].datetime | K 线时间(北京时间) |
| items[].factors | {KMID: v, KLEN: v, ..., VSUMD60: v} 共 159 项;预热期可能为 NaN/null |
| data.factor_names | 本接口所有因子名(按数组顺序),用于客户端自描述 |
| pagination | {page, page_size, total, total_pages} |
159 列宽表,单 response 大约 250 KB / 1000 条;建议按时间窗口分批。
没有 API Key?扫码加企微客服开通
覆盖标的
全市场 A 股
更新频率
T-2
所需会员
白金 及以上
在 Alpha 101 基础上扩展构造的 158 因子库,包含更细粒度的量价、动量、波动率类特征,可与 101 因子混合使用。
推荐用法
多因子模型扩展集合、风险模型构建
完整说明文档
Alpha158 因子说明文档
Qlib 标准因子集 — 158 个系统化量价因子
Alpha158 是微软 Qlib 平台内置的标准量化因子集,包含 158 个基于日频 OHLCV 数据(开盘价、最高价、最低价、收盘价、成交量、成交额)的量价因子。Alpha158 的设计定位是"开箱即用的因子工具箱"——它覆盖了从 K 线形态、趋势、波动率、成交量到价量相关性的几乎所有常见技术分析维度,为机器学习选股模型提供标准化的输入特征。
在本系统中,自动生成全部 158 个因子,配置了 5 个滚动窗口(5、10、20、30、60 日)的统计特征,最终输出 159 维因子向量。与 Alpha101 侧重"逻辑表达式"不同,Alpha158 更侧重"系统化的技术指标提取"——它本质上是一个标准化的特征工程管道。
描述单根 K 线的形态特征,将 OHLC 之间的结构关系量化为数值指标:
| 因子 | 计算公式 | 技术含义 |
|---|---|---|
| KMID | (Close - Open) / Open | 实体相对涨幅,正值为阳线,负值为阴线 |
| KLEN | (High - Low) / Open | 振幅(相对开盘价),衡量价格波动范围 |
| KMID2 | (Close - Open) / (High - Low + ε) | 实体占波动范围的比例。接近 ±1 = 光头光脚,接近 0 = 十字星 |
| KUP | (High - max(Open, Close)) / Open | 上影线占比,衡量上方抛压 |
| KUP2 | (High - max(Open, Close)) / (High - Low + ε) | 标准化上影线,与振幅无关的纯形态指标 |
| KLOW | (min(Open, Close) - Low) / Open | 下影线占比,衡量下方承接力度 |
| KSFT | 价格偏移量 | 前一周期价格的相对变化量 |
对价格和成交量序列进行滚动窗口统计,多尺度捕捉市场特征。本系统配置了 5 个窗口(5、10、20、30、60 日),每个窗口计算以下统计量:
| 统计量 | 说明 | Alpha 含义 |
|---|---|---|
| 均值 (Mean) | 窗口内价格的平均值 | 短均线上穿长均线 = 金叉(看涨) |
| 标准差 (Std) | 窗口内价格的波动幅度 | 高波动 = 风险大但机会也多 |
| 最大值/最小值 | 窗口内的极限价位 | 突破 N 日新高/新低是重要技术信号 |
| 偏度 (Skew) | 价格分布的不对称性 | 正偏 = 缓涨急跌,负偏 = 急涨缓跌 |
| 峰度 (Kurt) | 分布的肥尾程度 | 高峰度 = 极端行情频繁 |
| 分位数 | 排序位置统计 | 当前价位在历史上的相对高低位置 |
| 相关性 (Corr) | 价格与成交量的关联 | 量价正相关 = 趋势确认,负相关 = 背离 |
| 线性回归 | 趋势线的斜率和 R² | 量化趋势的强度和可信度 |
直接使用当日开盘价、最高价、最低价、VWAP 等价格特征,以及当日成交量及其与其他周期均量的比值。其中 VWAP(成交量加权均价)是关键特征——它代表了市场参与者的"平均成本",价格相对于 VWAP 的位置有重要的博弈意义。
| 维度 | Alpha101 | Alpha158 |
|---|---|---|
| 起源 | WorldQuant 2015 年论文 | 微软 Qlib 平台内置 |
| 因子数量(本系统) | 82 个 | 159 个 |
| 设计理念 | 公式化 Alpha 表达式,每个因子表达一个独立的投资逻辑 | 系统化特征工程,对价格序列做多窗口多统计量的标准化提取 |
| 计算复杂度 | 高(复杂表达式、大量嵌套函数) | 中(主要是滚动窗口统计) |
| 可解释性 | 高(每个公式有明确的投资含义) | 中(统计特征需要结合技术分析解读) |
| 窗口设置 | 各因子内部硬编码 | 统一 5 窗口(5/10/20/30/60 日) |
| 特色 | 量价背离、均值回归等精细逻辑 | K 线形态、多尺度趋势覆盖全面 |
| 典型因子示例 | #002: 量价背离检测 | MA5, STD20, CORR30 |
Alpha158 因子的生成同样基于 KunQuant 库,采用了模块化的构建方式:
**因子冗余:**约 30% 的因子 IC 均值接近 0,且部分多窗口因子(如 MA5/MA10/MA20)高度共线性,建议在使用前进行 IC 筛选、相关性过滤或 PCA 降维。
**归一化要求:**Alpha158 的原始因子值量纲差异极大(价格 vs 成交量 vs 比例),必须在输入模型前进行 Z-score 标准化或 RobustZScore 归一化。
**行业市值中性化:**与 Alpha101 相同,原始 Alpha158 因子可能包含行业和市值风格偏倚,需在中性化管道中统一处理。
**因子衰减:**技术因子的有效性会随市场环境变化而衰减。建议每季度进行因子 IC 评估,淘汰失效因子、纳入新因子,保持因子池的活力。