新基准评估大语言模型在印度金融法规上的表现

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员推出了 IndiaFinBench，这是一个旨在评估大语言模型在印度金融监管文本上表现的新基准。该基准填补了现有资源主要关注西方金融文件的空白。IndiaFinBench 包含 400 多个带注释的问答对，涵盖解释、数值推理、矛盾检测和时间推理，这些都源自印度 SEBI 和 RBI 的文件。 AI

影响为评估大语言模型在非西方金融法规上的表现建立了专门的基准，可能指导新兴市场的模型开发。

排序理由这是一篇介绍新大语言模型评估基准的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Rajveer Singh Pall · 2026-05-05 04:00

IndiaFinBench：用于评估大型语言模型在印度金融监管文本上表现的基准

arXiv:2604.19298v2 Announce Type: replace Abstract: We introduce IndiaFinBench, to our knowledge the first publicly available evaluation benchmark for assessing large language model (LLM) performance on Indian financial regulatory text. Existing financial NLP benchmarks draw excl…

报道来源 [1]

IndiaFinBench：用于评估大型语言模型在印度金融监管文本上表现的基准

相关实体

相关话题