English(EN) TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution

新的强化学习算法优化股票交易执行

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-07 00:20

研究人员开发了一种名为TT-DAC-PS的新型强化学习算法，用于优化股票交易执行。这种确定性Actor-Critic架构采用了多种先进技术，包括双目标、策略平滑和保守Q正则化，以最小化高估误差。该算法在美国股票数据上进行了测试，并证明其在减少执行成本方面优于传统方法和其他强化学习基线。 AI

影响引入了一种新颖的金融交易强化学习方法，有望提高执行效率并降低大型卖出程序的成本。

排序理由该集群包含一篇详细介绍特定应用新算法的研究论文。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Ilia Zaznov, Atta Badii, Julian Kunkel, Alfonso Dufour · 2026-06-09 04:00

TT-DAC-PS：用于最优交易执行的双目标确定性Actor-Critic与策略平滑

arXiv:2606.08379v1 Announce Type: new Abstract: This study addresses the optimal execution of large stock sell programs by introducing TT-DAC-PS (Twin-Target Deterministic Actor-Critic with Policy Smoothing), a deterministic actor-critic architecture that combines twin exponentia…
arXiv cs.AI TIER_1 English(EN) · Alfonso Dufour · 2026-06-07 00:20

TT-DAC-PS：用于最优交易执行的双目标确定性Actor-Critic与策略平滑

This study addresses the optimal execution of large stock sell programs by introducing TT-DAC-PS (Twin-Target Deterministic Actor-Critic with Policy Smoothing), a deterministic actor-critic architecture that combines twin exponential-moving-average critic targets with pessimistic…