实体
NeuCLIR
NeuCLIR
PulseAugur coverage of NeuCLIR — every cluster mentioning NeuCLIR across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 2 条
-
DoGMaTiQ 管道自动化生成用于报告评估的问答片段
研究人员开发了 DoGMaTiQ,这是一个新管道,旨在自动生成用于评估长篇报告的问答(QA)片段,特别是那些由检索增强生成(RAG)系统生成的报告。这一过程解决了手动整理这些评估片段的重大挑战,尤其是在跨语言环境中,这种挑战尤为困难。DoGMaTiQ 系统分三个阶段进行:生成基于文档的片段、对释义进行聚类以及根据质量标准进行子选择。在 TREC 共享任务上的实验表明,DoGMaTiQ 生成的 QA 片段与人类判断具有良好的相关性,并且…
-
研究人员推出Auto-ARGUE用于LLM报告生成评估
研究人员推出Auto-ARGUE,一个用于评估大型语言模型(LLM)生成报告质量的新框架,特别关注使用检索增强生成(RAG)的模型。该系统旨在评估引用支持的报告,这是RAG的一个常见应用。在TREC 2024任务上的初步测试表明,Auto-ARGUE与人类判断高度相关,并且发布了一个名为ARGUE-Viz的可视化工具来辅助分析。