返回因子超市

深度衍智大模型因子

大模型个股因子

钻石 会员可用

面向 A 股个股的大模型预测打分

API 接入

查询大模型个股因子(6 个模型并列打分)。按 stock_code 切片,时间范围内分页返回。

GET/api/v1/factors/stockScore/queryHeader 必带 X-API-Key

响应示例(真实数据)

{
  "code": "SUCCESS",
  "data": {
    "items": [
      {
        "stock_code": "sh600519",
        "date": "2026-05-29",
        "hour": 14,
        "m1": -0.229673, "m2": -0.043932, "m3": -0.292274,
        "m4": -0.437547, "m5": -0.249259, "m6": -0.116710
      }
    ],
    "pagination": {"page": 1, "page_size": 1, "total": 3001, "total_pages": 3001}
  },
  "message": "查询成功"
}

查询参数

参数类型必填说明
stock_code600519 / 600519.SH / sh600519必填股票代码,自动归一化
startYYYY-MM-DD可选起始日期(含端点)
endYYYY-MM-DD可选结束日期(不含端点)
hourint (14/15)可选过滤特定时点:14 盘中 / 15 收盘
pageint (默认 1)可选分页页码
page_sizeint (默认 500, 最大 5000)可选每页条数

调用示例(curl)

curl -G 'https://deepemerge.cn/api/v1/factors/stockScore/query' \
  -H 'X-API-Key: <你的密钥>' \
  --data-urlencode 'stock_code=600519' \
  --data-urlencode 'start=2026-01-01' \
  --data-urlencode 'hour=14' \
  --data-urlencode 'page_size=1000'

响应字段

字段说明
items[].stock_code归一化后股票代码(sh600519 形式)
items[].date交易日(YYYY-MM-DD)
items[].hour时点(14 盘中 / 15 收盘)
items[].m1 ~ m66 个模型打分(numeric)
pagination{page, page_size, total, total_pages}

建议按时间窗口切片调用;单股 7 年全历史约 1.5k 条,单次拉完无压力。

没有 API Key?扫码加企微客服开通

数据规格

覆盖标的

全市场 A 股

更新频率

T-2 历史下载 + 实时 API

所需会员

钻石 及以上

因子介绍

面向 A 股个股的大模型预测因子。每日给全市场个股输出预测打分,可用于按 top N 选股、构建多头组合或加入多因子模型。回测中已验证可在沪深 300 / 中证 1000 等股票池上稳定选出高胜率组合。

推荐用法

top N 选股、构建多头组合、与传统因子结合

完整说明文档

个股大模型预测因子说明

基于 Transformer 架构的 A 股个股 Alpha 预测模型

传统量化多因子模型依赖人工设计的财务指标、技术形态和统计特征,其信息上限受限于研究者的先验认知。随着 A 股上市公司数量突破 5000 家、市场结构日趋复杂,人工因子挖掘的边际回报持续递减。为此,我们构建了基于 Transformer 深度学习架构的个股 Alpha 预测模型,旨在突破传统框架的信息瓶颈,从海量高维数据中自动提取未被定价的 Alpha 信号。

模型采用 Encoder-Decoder 混合 Transformer 架构,输入端将个股的多维时序数据——包括日频与分钟频价量、财务基本面(季频映射到日频)、分析师一致预期变化、资金流向与股东结构变迁——统一编码为结构化 Token 序列。跨股票的注意力机制使模型能够同时学习个股的自身运行规律与横截面的相对强弱关系,将「这只股票在涨」和「它涨得比同行快」两种信息有机融合。输出端为每只股票生成日频预测分数,反映模型对其未来超额收益的综合判断。

训练分两阶段进行。第一阶段为全市场预训练:在近十年、数千只 A 股的面板数据上进行自监督学习,模型掌握通用市场动力学——趋势延续、均值回复、波动率聚集等无需人工定义的模式。第二阶段为截面微调:引入排序损失函数(ListNet / LambdaRank 变体),直接优化预测分数对未来收益的横截面排序质量。这一设计使得模型不仅关注单只股票的涨跌预测,更关注「哪些股票在下一期可能比其他股票表现更好」——即纯 Alpha 的排序能力,天然适配多因子选股的实际需求。

模型输出的预测分数可作为独立的 Alpha 因子纳入传统多因子体系。其核心属性包括:(1)日频更新,每个交易日收盘后基于最新数据重新生成预测,时效性远超月度或季度更新的基本面因子;(2)信息增量显著,与传统风格因子(市值、估值、动量、波动率等)的相关性可控,经中性化剥离后仍保留独立的选股能力;(3)覆盖面广,对全市场可交易股票均输出预测,支持沪深 300、中证 500、中证 1000 及全市场选股等多类策略;(4)可叠加性,可与人工因子、另类数据因子通过加权或机器学习元模型进一步融合,形成更强大的复合 Alpha 信号。

在实际投资流程中,该因子适用于三种核心场景。一是选股策略增强:将预测分数与传统多因子信号合成,提升组合的信息比率和超额收益稳定性。二是行业中性化选股:对模型原始预测做行业和市值中性化后,在行业内精选个股,控制风格暴露的同时获取纯 Alpha。三是动态仓位管理:结合个股预测分数与市场整体择时信号,在市场看多时集中持有高 Alpha 股票,看空时降低仓位或切换至防守型标的。从更宏观的视角看,大模型预测因子代表了量化投资从「人工定义规则」向「数据驱动发现」的范式升级——模型不再执行人类预设的策略逻辑,而是直接从数据中学习市场的生成机制,这为持续获取超越市场共识的 Alpha 提供了全新的路径。

(全文约 1200 字)