English(EN) Multi-Dimensional Behavioral Evaluation of Agentic Stock Prediction Systems Using LLM Judges with Closed-Loop Reinforcement Learning Feedback

大型语言模型裁判评估代理股票预测器，通过强化学习提高准确性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员开发了一个新颖的框架，通过利用大型语言模型作为裁判来评估代理股票预测系统。该系统将性能分解为六个特定维度，包括市场状态检测和风险校准，提供了比传统汇总指标更细致的评估。大型语言模型裁判，包括 GPT 5.4、Claude 4.6 Opus 和 Gemini 3.1 Pro，表现出高度的一致性，并与实际交易表现良好相关。这种行为评估随后被整合到强化学习反馈循环中，从而显著提高了预测准确性和交易策略。 AI

影响为在金融预测等复杂决策任务中评估和改进人工智能代理引入了一种新方法。

排序理由详细介绍人工智能系统新评估框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman · 2026-05-08 04:00

使用具有闭环强化学习反馈的LLM裁判对代理式股票预测系统进行多维度行为评估

arXiv:2605.05739v1 Announce Type: new Abstract: Agentic stock prediction systems make sequences of interdependent decisions (regime detection, pathway routing, reinforcement learning control) whose individual quality is hidden by aggregate metrics such as mean absolute percentage…

报道来源 [1]

使用具有闭环强化学习反馈的LLM裁判对代理式股票预测系统进行多维度行为评估

相关实体

相关话题