English(EN) Which LLM is the best stock picker? I built a benchmark to find out.

LLM基准1rok让GPT-5.5、Gemini 3.1、Grok 4.3展开股票选股竞赛

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-20 19:01

一个名为1rok的新基准已被推出，用于评估前沿大语言模型（LLM）的股票选股能力。该基准为每个参与的LLM分配10万美元的虚拟投资组合，并要求它们每周选择股票，同时跟踪相对于市场结果的表现。这项举措旨在提供对LLM比传统编码和推理基准更实用的下游评估，侧重于不确定性下的决策。 AI

影响提供了一个评估LLM在不确定性下决策能力的新颖基准，超越了传统的编码和推理任务。

排序理由文章描述了一个用于评估LLM在特定下游任务（股票选股）上表现的新基准，这是一种研究和评估的形式。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Achal Jhawar · 2026-05-20 19:01

哪个大型语言模型是最佳股票选股员？我构建了一个基准来找出答案。

<p>Every other week there's a new GPT-vs-Claude-vs-Gemini benchmark on coding or math or reasoning. None of them tell you whether the model can actually make a decision under uncertainty, where the answer isn't in the training data and the result shows up two weeks later in a P&a…