《MEME: Modeling the Evolutionary Modes of Financial Markets》
论文链接:https://arxiv.org/pdf/2602.11918v1
代码链接:https://github.com/gta0804/MEME
作者:Taian Guo, Haiyang Shen, Junyu Luo, Zhongshi Xing, Hanchun Lian, Jinsheng Huang, Binqi Chen, Luchen Liu, Yun Ma, Ming Zhang
摘要:大型语言模型(LLMs)通过处理大量非结构化数据,在量化金融领域展现出显著潜力,模仿人类的分析工作流程。然而,当前基于LLM的方法主要遵循两种范式:以资产为中心的范式,专注于个股预测;以市场为中心的方法,用于投资组合分配,通常对驱动市场运动的底层逻辑保持不可知。本文提出了一种逻辑导向的观点,将金融市场建模为一个动态、演化的竞争投资叙事生态系统,称为思维模式。为了实现这一观点,作者引入了MEME(模拟金融市场的演化模式),旨在通过演变的逻辑重建市场动态。MEME采用了一个多代理提取模块,将嘈杂的数据转化为高保真度的投资论点,并利用高斯混合模型在语义空间中揭示潜在共识。为了模拟不同市场条件下的语义漂移,作者还实施了一个时间评估和对齐机制,以追踪这些模式的生命周期和历史盈利性。通过优先考虑持久的市场智慧而非短暂的异常现象,MEME确保投资组合构建由稳健的逻辑指导。在2023年至2025年三个异构的中国股票池上的广泛实验表明,MEME一致性地超越了七个SOTA基线。进一步的消融研究、敏感性分析、生命周期案例研究和成本分析验证了MEME识别和适应金融市场演变共识的能力。
《AlphaPROBE: Alpha Mining via Principled Retrieval and On-graph biased evolution》
论文链接:https://arxiv.org/pdf/2602.11917v1
代码链接:https://github.com/gta0804/AlphaPROBE
作者:Taian Guo, Haiyang Shen, Junyu Luo, Binqi Chen, Hongjun Ding, Jinsheng Huang, Luchen Liu, Yun Ma, Ming Zhang
摘要:通过alpha因子挖掘提取信号是量化金融中的一个基本挑战。现有的自动化方法主要遵循两种范式:解耦因子生成,将因子发现视为孤立事件;迭代因子演化,专注于局部父子关系的精细化。然而,这两种范式都缺乏全局结构视图,通常将因子池视为非结构化集合或碎片化链,导致冗余搜索和有限多样性。为了解决这些限制,作者引入了AlphaPROBE(通过原则性检索和图形有偏演化的Alpha挖掘),一个框架,将alpha挖掘重新定义为有向无环图(DAG)的原则性检索。通过将因子建模为节点,将演化链接为边,AlphaPROBE将因子池视为一个动态的、相互连接的生态系统。该框架由两个核心组件组成:一个贝叶斯因子检索器,通过后验概率模型平衡利用和探索,识别高潜力种子;以及一个DAG感知的因子生成器,利用因子的完整祖先追踪来产生上下文感知的、非冗余的优化。在三个主要的中国股票市场数据集上与8个竞争基线的广泛实验表明,AlphaPROBE在预测准确性、回报稳定性和训练效率方面显著提升了性能。结果证实,利用全局演化拓扑对于高效和稳健的自动化alpha发现至关重要。
《Cross-Sectional Asset Retrieval via Future-Aligned Soft Contrastive Learning》
论文链接:https://arxiv.org/pdf/2602.10711v1
作者:Hyeongmin Lee, Chanyeol Choi, Jihoon Kwon, Yoon Kim, Alejandro Lopez-Lira, Wonbin Ahn, Yongjae Lee
摘要:资产检索——在金融范围中寻找相似资产——是量化投资决策的核心。现有方法通过历史价格模式或行业分类来定义相似性,但这些向后看的标准不能保证未来行为。作者认为,有效的资产检索应该是未来对齐的:检索到的资产应该是那些最有可能表现出相关未来回报的资产。为此,作者提出了未来对齐的软对比学习(FASCL),这是一个表示学习框架,其软对比损失使用成对的未来回报相关性作为连续的监督目标。进一步引入了一个评估协议,直接评估检索到的资产是否共享类似的未来轨迹。在4,229个美国股票上的实验表明,FASCL在所有未来行为指标上一致性地超越了13个基线。
《Systematic Trend-Following with Adaptive Portfolio Construction: Enhancing Risk-Adjusted Alpha in Cryptocurrency Markets》
论文链接:https://arxiv.org/pdf/2602.11708v1
作者:Duc Bui, Thanh Nguyen
摘要:加密货币市场表现出明显的动量效应和依赖于市场环境的波动性,为系统性交易策略提供了机会和挑战。作者提出了一个名为AdaptiveTrend的多组件算法交易框架,该框架将6小时间隔的高频趋势跟踪与月度自适应投资组合构建和不对称的长短期资本分配相结合。该框架引入了三个关键创新:(1)一个动态跟踪停止机制,校准到日内波动性;(2)一个基于滚动夏普比率的资产选择程序,具有市值意识的过滤;(3)一个理论上有动机的不对称70/30长短期分配方案,基于加密货币市场的实证正漂移。通过在150多个加密货币对上进行广泛的样本外回测,评估窗口为36个月(2022-2024),AdaptiveTrend实现了2.41的年化夏普比率,最大回撤率为-12.7%,Calmar比率为3.18,显著优于基准趋势跟踪策略(TSMOM,时间序列动量)和等权重买入持有组合。作者进一步进行了严格的鲁棒性分析,包括参数敏感性、交易成本建模和基于市场环境的性能分解,证明了策略在牛市、熊市和横盘市场条件下的韧性。
《Adaptive Acquisition Selection for Bayesian Optimization with Large Language Models》
论文链接:https://arxiv.org/pdf/2602.07904v1
作者:Giang Ngo, Dat Phan Trong, Dang Nguyen, Sunil Gupta, Svetha Venkatesh
摘要:贝叶斯优化在很大程度上取决于获取函数的选择,但没有单一策略是普遍最优的;最佳选择是非静态的,且依赖于问题。现有的自适应投资组合方法通常基于过去的函数值来做出决策,而忽略了剩余预算或替代模型特征等更丰富的信息。为了解决这个问题,作者引入了LMABO,一个新颖的框架,将预训练的大型语言模型(LLM)作为一个零样本、在线策略家用于BO过程。在每次迭代中,LMABO使用结构化的状态表示来提示LLM从多样化的投资组合中选择最合适的获取函数。在对50个基准问题的评估中,LMABO显示出比强大的静态、自适应投资组合和其他基于LLM的基线有显著的性能提升。作者展示了LLM的行为是一个全面策略,能够适应实时进展,证明了其优势源于其处理和综合完整优化状态的能力,形成一个有效的、自适应的政策。
往期精彩文章🧡🧡🧡
论文合集
大模型
Paper Reading | HiveMind: 根据贡献在线优化大模型多智能体交易系统
Paper Reading | FinAgent编排框架: 从算法交易迈向代理交易的范式转变
Paper Reading | CMU验证:复杂的多智能体机制不一定能提升投资收益
Paper Reading | Alpha-R1: 基于强化学习与大模型推理的Alpha因子筛选新方法
Paper Reading | FinRS: 面向真实金融市场的风险敏感型交易框架
Paper Reading | VTA: 结合大模型推理实现精准且可解释的股票时序预测
Paper Reading | TradingGroup: 基于自我反思与数据合成的多智能体量化交易系统
Paper Reading | MARS: 面向风险感知的多智能体强化学习投资组合管理框架
Paper Reading | FinKario: 事件增强的金融知识图谱自动化构建,A股夏普比4.9
Paper Reading | MM-DREX: 基于多模态大模型的专家动态路由框架用于金融交易
Paper Reading | EFS:基于大模型的因子搜索框架,实现稀疏组合优化
Paper Reading | MERA: 清华易方达联合提出基于RAG的MOE模型,选股性能提升11%
Paper Reading | AlphaEval: 面向Alpha挖掘的全面高效评估框架
Paper Reading | MaGNet: 基于时间因果与全局关系学习的Mamba双超图股票预测网络
Paper Reading | MLF: 金融时序预测的多周期学习框架
Paper Reading | AlphaSAGE: 基于图的鲁棒Alpha因子挖掘框架
Paper Reading | HRFT: 利用Transformer端到端挖掘高频风险因子
Paper Reading | SSPT: 针对股票数据的预训练任务,显著提升选股性能
Paper Reading | Enhancer: 时间关系元学习分布感知框架用于股票预测,夏普比提升19%
Paper Reading | FTS-Text-MoE: 融合推文和时序的混合专家模型用于股票预测
Paper Reading | FinZero: 基于推理大模型的多模态金融时间序列预测
Paper Reading | MoFE-Time: 时序预测的频域专家混合模型
论文标题: AlphaSAGE: Structure-Aware Alpha Mining via GFlowNets for Robust Exploration 作者单位: 论文链接: https://arxiv.org/pdf/2509.25055 研究内容: 预测性信号的自动化挖掘是量化金融中的核心挑战。尽管强化学习已成为生成公式化 Alpha 的一种有前景范式,但现有框架普遍受到三类相互关联问题的根本制约。首先,这些方法存在奖励稀疏性问题,即只有在完整公式构建完成后才能获得有效反馈,导致探索过程低效且不稳定。其次,它们通常依赖对数学表达式进行语义不足的序列表征,难以捕捉决定 Alpha 行为的结构信息。第三,标准 RL 以最大化期望收益为目标,这会天然地驱动策略收敛到单一最优模式,而这与实际中需要构建多样化、低相关 Alpha 组合的需求直接冲突。为解决上述问题,作者提出 AlphaSAGE(Structure-Aware Alpha Mining via Generative Flow Networks for Robust Exploration),该框架建立在三项关键创新之上:(1)基于关系图卷积网络(RGCN)的结构感知编码器;(2)基于生成流网络(GFlowNets)的新型生成框架;(3)一种稠密的、多维度奖励结构。大量实证结果表明,AlphaSAGE 相较于现有基线方法,能够挖掘出更多样、更新颖且预测能力更强的 Alpha 组合,从而为自动化 Alpha 挖掘提出了一种新的研究范式。 论文标题: Trade in minutes! rationality-driven agentic system for quantitative financial trading 作者单位: 论文链接: https://arxiv.org/pdf/2510.04787? 研究内容: 近年来,大语言模型(LLMs)与智能体系统的快速发展展现出卓越的决策能力,显示出其在自主金融领域中的巨大潜力。然而,现有金融交易智能体大多模拟具有人格化特征的角色,这类设计往往会引入情绪偏差、依赖外围信息,并且在实际部署时受制于持续推理带来的高成本与高延迟。针对上述问题,作者首次尝试将智能体的战略深度与量化交易所要求的机械理性相统一,提出 TiMi(Trade in Minutes),一种由理性驱动的多智能体系统,在架构层面实现了策略开发与分钟级部署的解耦。TiMi 在完整的“策略—优化—部署”链条中综合利用大语言模型在语义分析、代码编程与数学推理方面的专长,具体提出了:从宏观模式到微观定制的双层分析范式、面向交易机器人实现的分层编程设计,以及由数学反思驱动的闭环优化机制。作者在股票与加密货币市场中针对 200 余个交易对开展了大规模评估,实验结果表明,TiMi 在稳定盈利能力、动作执行效率以及风险控制能力方面均表现出显著优势,并能够在高度波动的市场环境下保持稳健表现。整体而言,该研究表明,通过将复杂分析与时间敏感型执行进行架构解耦,并充分发挥不同类型大语言模型在推理、编程与策略反思方面的互补能力,可以构建兼具战略深度、部署效率与风险韧性的新一代量化交易智能体系统。 模型框架 论文标题: AlphaAgentEvo: Evolution-Oriented Alpha Mining via Self-Evolving Agentic Reinforcement Learning 作者单位: 中山大学 论文链接: https://openreview.net/forum?id=lNmZrawUMu 研究内容: Alpha 挖掘旨在从庞大且噪声极强的搜索空间中识别能够相对于市场产生超额收益的预测性 Alpha 因子。然而,现有基于进化的方法在促进 Alpha 的系统性进化方面仍存在明显不足。传统方法如遗传编程(GP)无法理解自然语言指令,且通常难以从失败尝试中提取有价值的经验,因此存在可解释性不足与探索效率低下的问题。类似地,现有多智能体方法由于缺乏长期规划与反思等系统性进化机制,容易陷入重复性的进化模式,导致搜索效率低下。为克服这些局限,作者提出 AlphaAgentEvo,一种面向 Alpha 挖掘的自演化智能体强化学习(Agentic Reinforcement Learning, ARL)框架,将 Alpha 挖掘从脆弱的“搜索—回测—重启”循环推进为一个连续的进化轨迹。该框架在分层奖励函数的引导下,使智能体在搜索空间中进行自探索,逐步学习基础要求(如有效工具调用)以及更复杂目标(如性能的持续改进)。在这一过程中,智能体能够习得长时程规划与反思性推理等高级行为,从而根据底层状态(如市场 regime 转移)主动调整行为,实现真正意义上的自演化智能体,并推动 Alpha 挖掘走向更具原则性与可扩展性的范式。大量实验结果表明,AlphaAgentEvo 能够实现更高效的 Alpha 进化,并生成具有多样性与可迁移性的 Alpha,在多项基线比较中持续取得领先。尤其值得注意的是,即使仅有 4B 参数规模,该方法仍然优于配置了当前最先进闭源推理模型的 LLM 驱动进化方法,表明 ARL 在下一代 Alpha 挖掘中的巨大潜力。 模型框架 论文标题: AlphaBench: Benchmarking Large Language Models in Formulaic Alpha Factor Mining 作者单位: 论文链接: https://openreview.net/forum?id=d97Q8r7ZKZ 研究内容: 公式化 Alpha 因子挖掘(Formulaic Alpha Factor Mining, FAFM)是量化投资中的一个核心问题,其目标是设计具有可解释性的数学公式,以从历史金融序列中提取具有预测能力的信号。随着大语言模型(LLMs)的兴起,近期研究开始探索其在 FAFM 中的作用,但其在不同任务与配置下的能力边界仍不清晰。为此,作者提出 AlphaBench,这是首个面向 FAFM 中 LLM 能力的系统性基准。AlphaBench 涵盖三个核心任务:因子生成(factor generation)、因子评估(factor evaluation)以及因子搜索(factor searching),这些任务均是量化研究人员工作流中的常见环节。除任务层面的评测外,作者还进一步分析了不同 LLM 设置——包括模型类型、提示范式以及推理策略——对性能的影响。作者在一系列开源与闭源模型上的实验表明,LLMs 在自动化因子挖掘方面展现出较强潜力,但同时也面临一些持续性的挑战,包括鲁棒性不足、搜索效率有限以及实际可用性问题。整体而言,AlphaBench 为系统理解大语言模型在公式化 Alpha 因子挖掘中的能力、局限与优化方向提供了统一而可复现的评测框架。 框架流程 论文标题: Shift-Tolerant Allocation via Black-Litterman Using Conditional Diffusion Estimates 作者单位: 首尔大学 论文链接: https://openreview.net/forum?id=VltZQpfarw 研究内容: 在市场状态持续切换的动态金融市场中,如何在市场 regime 变化及其影响不断演化的条件下做出有效投资决策,是金融人工智能中的关键问题。其中,投资组合配置因其直接关系到风险—收益权衡与真实投资落地效果,具有尤为重要的实践意义。然而,要获得稳健的风险调整后收益极具挑战性,因为各类资产的收益与波动率都会随着市场 regime 的变化而不断波动。针对这一问题,现代投资组合理论通常依赖历史收益估计资产的均值与协方差,并通过优化风险—收益目标求解资产权重;强化学习方法则尝试利用资产价格与宏观经济指标,直接学习风险调整后的配置决策。基于此,作者提出 STABLE(Shift-Tolerant Allocation via Black–Litterman Using Conditional Diffusion Estimates),该方法将一种能够捕捉 regime 转移的扩散式生成模型与一个以期望风险调整收益最大化为目标的估计式资产配置模块相结合。STABLE 以宏观经济背景与个股特征信号为输入,生成能够同时反映当前宏观 regime 与个股特异性动态的逐股票收益轨迹,从而得到具备 regime 感知能力的单股票预测收益分布以及一致性的协方差结构,并进一步将这些结果作为投资者观点注入 Black–Litterman 配置模块,以获得兼顾风险分散的投资组合权重。实证结果表明,STABLE 在多个主要股票市场中均取得了显著优于基线方法的投资组合表现,其 Sharpe 比率最高提升可达 122.9%,同时还伴随着更低的回撤水平;此外,在时间序列估计任务上,该方法也取得了当前最优性能,相较于生成式基线模型,MSE 最高降低 15.7%。整体而言,该研究表明,通过将条件扩散生成、regime 感知收益分布建模与 Black–Litterman 配置机制进行有机结合,可以有效提升分布转移环境下投资组合配置的稳健性、预测准确性与实用价值。 模型框架 论文标题: Reasoning on Time-Series for Financial Technical Analysis 作者单位: 新加坡国立大学 论文链接: https://arxiv.org/abs/2511.08616 研究内容: 尽管大语言模型(LLMs)已被用于生成可解释的股票预测,但现有方法主要聚焦于分析文本报告,而较少直接处理历史价格数据,即所谓的技术分析(Technical Analysis)。这一任务具有挑战性,因为它涉及跨域转换:股票价格的输入与输出位于时间序列域,而推理过程则需要在自然语言域中展开。为此,作者提出 Verbal Technical Analysis(VTA),一种新颖框架,通过结合显式语言推理与潜在表示推理,生成既准确又可解释的股票时间序列预测。为实现对时间序列的推理,作者首先将股票价格数据转换为文本注释,随后通过一个基于逆均方误差(inverse MSE)奖励目标的优化机制对推理轨迹进行优化。为了从文本推理生成时间序列输出,作者进一步将时间序列主干模型的输出条件化于基于推理得到的属性表示。作者在美国、中国与欧洲市场的多个股票数据集上进行了实验,结果表明,VTA 在预测精度上取得了当前最优性能,同时生成的推理轨迹在由行业专家参与的评价中也表现良好。整体而言,该研究表明,通过将金融技术分析信号的语言化表达与时间序列预测模型的条件生成机制相结合,可以有效提升金融时间序列预测的准确性、可解释性与实际应用价值。 模型框架同济大学
香港城市大学
往期推荐阅读
解读:LLM Agents 在标普500财报预测中的应用研究
【python量化】多种Transformer模型用于股价预测(Autoformer, FEDformer和PatchTST等)
【python量化】挖掘股价中的图关系:基于图注意力网络的股价预测模型
Three dimensional architected thermoelectric devices with high toughness and power conversion effici