PulseAugur
实时 13:37:08
English(EN) TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution

新的强化学习算法优化股票交易执行

研究人员开发了一种名为TT-DAC-PS的新型强化学习算法,用于优化股票交易执行。这种确定性Actor-Critic架构采用了多种先进技术,包括双目标、策略平滑和保守Q正则化,以最小化高估误差。该算法在美国股票数据上进行了测试,并证明其在减少执行成本方面优于传统方法和其他强化学习基线。 AI

影响 引入了一种新颖的金融交易强化学习方法,有望提高执行效率并降低大型卖出程序的成本。

排序理由 该集群包含一篇详细介绍特定应用新算法的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Ilia Zaznov, Atta Badii, Julian Kunkel, Alfonso Dufour ·

    TT-DAC-PS:用于最优交易执行的双目标确定性Actor-Critic与策略平滑

    arXiv:2606.08379v1 Announce Type: new Abstract: This study addresses the optimal execution of large stock sell programs by introducing TT-DAC-PS (Twin-Target Deterministic Actor-Critic with Policy Smoothing), a deterministic actor-critic architecture that combines twin exponentia…

  2. arXiv cs.AI TIER_1 English(EN) · Alfonso Dufour ·

    TT-DAC-PS:用于最优交易执行的双目标确定性Actor-Critic与策略平滑

    This study addresses the optimal execution of large stock sell programs by introducing TT-DAC-PS (Twin-Target Deterministic Actor-Critic with Policy Smoothing), a deterministic actor-critic architecture that combines twin exponential-moving-average critic targets with pessimistic…