PulseAugur
实时 08:30:19
实体 Yidong Jiang

Yidong Jiang

PulseAugur coverage of Yidong Jiang — every cluster mentioning Yidong Jiang across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_86838 ·

    新的 Fin-RATE 基准测试 LLM 处理复杂的金融文件

    研究人员推出了 Fin-RATE,这是一个新的基准,旨在评估大型语言模型 (LLM) 使用 SEC 文件在真实世界金融分析任务上的表现。与之前的基准不同,Fin-RATE 评估 LLM 跨多个文档、报告期和公司实体综合信息的能力,并对其性能瓶颈进行分类,例如检索失败和生成不准确。对 17 个 LLM 的基准测试显示,随着任务变得更加复杂,性能显著下降,从单文档推理转向纵向和跨实体分析时,准确率下降了 18% 以上。