深度衍智大模型因子
基于大模型从量价数据中蒸馏的衍生因子
查询大模型量价因子(26 个因子,60 分钟级,后复权)。按 symbol 切片,时间范围内分页返回。
/api/v1/factors/volumePrice/queryHeader 必带 X-API-Key响应示例(真实数据)
{
"code": "SUCCESS",
"data": {
"items": [
{
"symbol": "sz000400",
"datetime": "2013-07-15T14:00:00",
"overnight_gap": -0.009669891,
"efficiency_ratio": 0.014651214,
"lin_reg_slope": -0.00020518457,
"lin_reg_r2": 0.023341602,
"bias_128": 0.07879423,
"donchian_pos": 0.8723898,
"price_accel": 0.034565773,
"vol_parkinson": 0.016681362,
"pv_corr": 0.6288479,
"rvol": 0.7353656,
"amihud_illiq": 0.020750202,
"vwap_dev_24": 0.044359364
// ... 共 26 个因子
}
],
"pagination": {"page": 1, "page_size": 1, "total": 495, "total_pages": 495}
},
"message": "查询成功"
}查询参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| symbol | sh600519 / 600519.SH | 必填 | 股票代码,自动归一化 |
| start | YYYY-MM-DD | 可选 | 起始日期(含端点) |
| end | YYYY-MM-DD | 可选 | 结束日期(不含端点) |
| page | int (默认 1) | 可选 | 分页页码 |
| page_size | int (默认 500, 最大 5000) | 可选 | 每页条数 |
调用示例(curl)
curl -G 'https://deepemerge.cn/api/v1/factors/volumePrice/query' \
-H 'X-API-Key: <你的密钥>' \
--data-urlencode 'symbol=sh600519' \
--data-urlencode 'start=2026-01-01' \
--data-urlencode 'page_size=2000'响应字段
| 字段 | 说明 |
|---|---|
| items[].symbol | 归一化后股票代码 |
| items[].datetime | K 线时间(北京时间) |
| items[].overnight_gap, efficiency_ratio, ... | 26 个量价因子,全部为 double precision;预热期允许 NULL |
| pagination | {page, page_size, total, total_pages} |
单股全市场 7 年约 6 万条 60 分钟 K 线,建议按时间窗口拉取,避免一次性请求过大。
没有 API Key?扫码加企微客服开通
覆盖标的
全市场 A 股
更新频率
T-2
所需会员
白金 及以上
利用大模型从量价数据中蒸馏的衍生因子集合,捕捉短期市场结构变化。相较于人工构造的量价因子,能从原始量价中提取更高阶的非线性特征。
推荐用法
与 101 / 158 因子组合使用,强化短期信号
完整说明文档
量价大模型因子说明文档
基于高频数据与市场微观结构的 26 个技术因子 V3.0
量价大模型因子是一套自主开发的高频量价技术因子集(V3.0),共包含 26 个因子,基于股票的分钟级 OHLCV(开盘价、最高价、最低价、收盘价、成交量、成交额)数据计算。因子的核心理念是:市场微观结构(如日内走势形态、资金流向、成本分布、波动率聚集等)包含了丰富的 Alpha 信息,这些信息在日频数据中往往被"平均化"而丢失。
因子涵盖七大类别:隔夜情绪、动量与趋势、波动率与结构、成交量与微观结构、高阶矩、日内强度、成本与流动性分析。短周期参数(24 个 K 线)捕捉近期微观变化,长周期参数(128 个 K 线)捕捉中期趋势特征。
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 1 | overnight_gap(隔夜跳空力度) | 当日开盘价 / 昨日收盘价 - 1,仅保留当日首根 K 线并向前填充 | 隔夜信息(政策、外盘、公告)的集中释放,跳空力度反映市场对信息的定价强度。正向跳空预示强势,负向跳空临近支撑位则蕴含均值回归机会 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 2 | efficiency_ratio(趋势效率系数) | |Close - Close_N| / Sum(|ΔClose|), N=128 | 衡量价格运动的"方向纯净度"。效率系数高=流畅趋势,效率系数低=震荡行情。用来过滤趋势策略的信号质量 |
| 3 | lin_reg_slope(线性回归斜率) | 128 周期滚动线性回归斜率,除以价格标准化 | 量化"涨跌速度"。正值且越大=加速上涨;负值且越小=加速下跌。标准化后使不同价位股票可比 |
| 4 | lin_reg_r2(趋势拟合度) | 128 周期滚动线性回归的 R² | 衡量趋势的可信度。R² 接近 1 = 高度线性趋势(确定性高);R² 接近 0 = 随机游走(噪声为主) |
| 5 | bias_128(乖离率) | (Close - MA_128) / MA_128 | 价格相对长期均线的偏离程度。负乖离过大=超卖,正乖离过大=超买。经典的均值回归指标 |
| 6 | donchian_pos(价格位置) | (Close - Low_128) / (High_128 - Low_128) | 价格在 128 周期范围内的相对位置。0=最低点,1=最高点。结合趋势判断可用于突破或反转策略 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 7 | price_accel(价格加速度) | (V_current - V_previous),其中 V = 3周期涨跌幅 | 动量变化的速率。正加速度=趋势加速(顺势),负加速度=趋势减弱(可能反转)。比单纯动量更早捕捉拐点 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 8 | vol_parkinson(帕金森波动率) | sqrt(Mean(ln(H/L)²) / (4·ln(2))), N=128 | 仅用最高最低价估算波动率,比收盘价标准差更高效。高波动=不确定性大,低波动=酝酿突破 |
| 9 | shadow_upper_ratio(上影线压力) | 24周期上影线总和 / 24周期振幅总和 | 上方抛压的量化指标。上影线占比高=多头尝试上攻但被空头压制,短期看跌信号 |
| 10 | shadow_lower_ratio(下影线支撑) | 24周期下影线总和 / 24周期振幅总和 | 下方买盘的量化指标。下影线占比高=空头打压但被多头承接,短期看涨信号 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 11 | natr(归一化真实波幅) | 24周期 ATR / Close | 波动率相对当前价格的百分比。使不同价位股票的波动率可比,用于仓位管理和止损设置 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 12 | pv_corr(量价相关性) | 24周期 Close 与 Vol 的相关系数 | 量价同步=趋势确认;量价背离=趋势存疑。经典技术分析中"量价配合"的量化版本 |
| 13 | rvol(相对成交量) | Vol / MA_128(Vol) | 当前成交量相对历史均值的高低。>1.5=放量(关注度高),<0.5=缩量(无人问津) |
| 14 | money_flow_norm(标准化资金流向) | 24周期 CLV×Vol 均值 / 24周期 Vol 均值 | 基于"量在价先"原则的资金净流向。正值=资金净流入(价格在上部运行),负值=资金净流出 |
| 15 | amihud_illiq(Amihud 非流动性) | |收益率| / 成交额 的 128 周期均值 × 10⁸ | 衡量"单位成交额对价格的影响"。数值越大=流动性越差,买卖冲击成本越高。对机构资金有重要参考 |
| 16 | vol_std_ratio(成交量波动率比) | 128周期 Vol 标准差 / 128周期 Vol 均值 | 成交量本身的波动程度。异动增加=资金面分歧加大,往往是行情变化的先行指标 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 17 | barrier_dist(整数关口距离) | |Close - Round(Close)| / Close | 价格距离最近整数的相对距离。价格在整数关口附近存在"磁吸效应"和"突破效应",是行为金融学的应用 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 18 | skew(偏度) | 128周期收益率的偏度 | 收益分布的不对称性。正偏=大涨多小跌少(慢牛),负偏=大跌多小涨少(急跌)。负偏度反转常蕴含机会 |
| 19 | kurt(峰度) | 128周期收益率的峰度 | 收益分布的"肥尾"程度。高峰度=极端行情频发,低峰度=平稳运行。用于尾部风险预警 |
| 20 | downside_vol_ratio(下行风险占比) | 下行标准差 / 总标准差, N=128 | 波动的不对称性。>0.5=下跌波动贡献更大(偏空信号),<0.5=上涨波动贡献更大 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 21 | intraday_intensity(日内强度) | (Close - Open) / (High - Low) | 日内多空博弈的结果。-1=最低价收盘(空方完胜),+1=最高价收盘(多方完胜)。反映日内主导力量 |
| 编号 | 因子名称 | 描述 | Alpha 逻辑 |
|---|---|---|---|
| 22 | vwap_dev_24(短期成本偏离) | (Close - VWAP_24) / VWAP_24 | 价格相对于 24 周期成交量加权均价(市场平均成本)的偏离。高于 VWAP=大多数持有者浮盈,低于 VWAP=浮亏。是核心因子 |
| 23 | vwap_dev_128(长期成本偏离) | (Close - VWAP_128) / VWAP_128 | 同上但更长周期,反映中期成本结构 |
| 24 | vwap_zscore_24(成本穿透力) | (Close - VWAP_24) / Std(Close, 24) | 将成本偏离用波动率标准化,衡量偏离的"统计显著性"。|Z|>2=显著偏离成本区,可能有回归动力 |
| 25 | vwap_slope_24(成本趋势) | VWAP_24 的滚动线性回归斜率 | 市场平均成本的移动方向。成本上升=资金持续流入推高(看涨),成本下降=资金流出 |
| 26 | price_cost_div(量价背离) | Close 的 24周期涨跌幅 - VWAP_24 的 24周期涨跌幅 | 价格变化与成本变化的差。价格上涨但成本未跟=虚涨(可能回落),价格下跌成本不降=假跌 |
因子采用全向量化计算,核心优化包括:
输入数据为分钟级高质量复权数据,输出时仅保留每日 14:00 时刻的因子快照,既保证了因子质量又控制了数据存储规模。
因子V3.0 相比前两代的核心改进: