English(EN) A3M: Adaptive, Adversarial and Multi-Objective Learning for Strategic Bidding in Repeated Auctions

新的A3M框架增强了人工智能在重复拍卖中的竞价策略

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了一个名为A3M的新框架，用于在具有奖励反馈的重复拍卖中优化竞价策略。该框架整合了自适应深度强化学习、对抗性推理和多目标奖励设计，以克服现有方法的局限性。A3M通过动态平衡探索与利用、建模非平稳对手以及联合最大化竞价者效用、拍卖师收入和公平性，旨在增强适应性和策略鲁棒性。实证评估表明，A3M显著降低了遗憾值，并在对抗策略变化时保持了稳健的性能。 AI

影响引入了一种新的拍卖策略竞价框架，有望提高资源分配的效率和公平性。

排序理由该集群包含一篇详细介绍新框架及其经验评估的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Junhan Li, Yuxin Zhang, Haoran Wang, Minghao Chen · 2026-06-30 04:00

A3M：用于重复拍卖中战略竞价的自适应、对抗和多目标学习

arXiv:2606.28943v1 Announce Type: new Abstract: Learning to bid in repeated multi-unit auctions with bandit feedback poses a fundamental challenge. Existing methods often rely on rigid explore-then-exploit schedules, assume stationary adversaries, and optimize solely for bidder u…

报道来源 [1]

A3M：用于重复拍卖中战略竞价的自适应、对抗和多目标学习

相关实体

相关话题