研究人员推出了 IndiaFinBench,这是一个旨在评估大语言模型在印度金融监管文本上表现的新基准。该基准填补了现有资源主要关注西方金融文件的空白。IndiaFinBench 包含 400 多个带注释的问答对,涵盖解释、数值推理、矛盾检测和时间推理,这些都源自印度 SEBI 和 RBI 的文件。 AI
影响 为评估大语言模型在非西方金融法规上的表现建立了专门的基准,可能指导新兴市场的模型开发。
排序理由 这是一篇介绍新大语言模型评估基准的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →