研究人员开发了一种强化学习 (RL) 代理来动态定价杂货,旨在平衡即时销售与长期客户价格预期。该代理在一个由心理上多样化的购物者组成的模拟市场中从头开始训练。它学会了管理价格锚点、客户保留和损耗,最终在它在训练期间未遇到过的产品上,其表现也显著优于手动调整的启发式定价策略。 AI
影响 展示了 RL 在零售复杂决策中的新颖应用,有可能提高利润率和客户保留策略。
排序理由 该条目描述了强化学习在特定问题领域(动态定价)中的新颖应用,并详细介绍了训练过程和结果,符合研究的定义。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →