实体 NeuCLIR

NeuCLIR

PulseAugur coverage of NeuCLIR — every cluster mentioning NeuCLIR across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_20598 · May 6 · 03:34

DoGMaTiQ 管道自动化生成用于报告评估的问答片段

研究人员开发了 DoGMaTiQ，这是一个新管道，旨在自动生成用于评估长篇报告的问答（QA）片段，特别是那些由检索增强生成（RAG）系统生成的报告。这一过程解决了手动整理这些评估片段的重大挑战，尤其是在跨语言环境中，这种挑战尤为困难。DoGMaTiQ 系统分三个阶段进行：生成基于文档的片段、对释义进行聚类以及根据质量标准进行子选择。在 TREC 共享任务上的实验表明，DoGMaTiQ 生成的 QA 片段与人类判断具有良好的相关性，并且…
RESEARCH · CL_10113 · Apr 30 · 04:00

研究人员推出Auto-ARGUE用于LLM报告生成评估

研究人员推出Auto-ARGUE，一个用于评估大型语言模型（LLM）生成报告质量的新框架，特别关注使用检索增强生成（RAG）的模型。该系统旨在评估引用支持的报告，这是RAG的一个常见应用。在TREC 2024任务上的初步测试表明，Auto-ARGUE与人类判断高度相关，并且发布了一个名为ARGUE-Viz的可视化工具来辅助分析。