实体 Yannis Montreuil

Yannis Montreuil

PulseAugur coverage of Yannis Montreuil — every cluster mentioning Yannis Montreuil across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 4

发布 · 30天

90 天内 0

论文 · 30天

90 天内 4

层级分布 · 90 天

关系

authored by Learning to Defer 50%

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 4 条

TOOL · CL_42139 · May 21 · 04:00

新框架优化LLM在抽取式问答中的使用

研究人员开发了一个学习延迟（Learning-to-Defer）框架，以提高使用大型语言模型（LLM）进行抽取式问答（EQA）的效率。该方法智能地将查询分配给专用模型，确保高置信度的预测，同时最大限度地降低计算成本。该框架在SQuADv1和TriviaQA等数据集上进行了测试，证明了其提高了答案的可靠性并显著降低了计算开销，使其适用于可扩展的EQA部署。
RESEARCH · CL_42136 · May 21 · 04:00

新的学习延迟方法利用专家建议和多专家协作

研究人员开发了新的“学习延迟”（L2D）系统方法，该系统决定是进行预测还是咨询专家。最新的进展通过允许系统不仅选择专家，还为该专家提供额外的、特定于上下文的信息，从而解决了现有框架中的局限性。新方法还将L2D扩展到同时利用多个专家，使系统能够查询成本效益最高的k个实体或根据输入难度调整专家数量。
TOOL · CL_42134 · May 21 · 04:00

新框架提升单阶段延迟学习系统的对抗鲁棒性

研究人员开发了一个新框架，以增强单阶段延迟学习（L2D）系统的对抗鲁棒性。该方法解决了 L2D 模型中的漏洞，这些模型可能被对抗性扰动操纵，从而改变预测和延迟决策。提出的方法包括形式化攻击、引入成本敏感的对抗性代理损失，并为分类和回归任务提供理论保证。实验表明，在保持干净数据性能的同时，针对各种攻击的鲁棒性得到了提高。
RESEARCH · CL_29305 · May 12 · 16:19

新的在线算法增强了具有动态专家的延迟学习

研究人员开发了一种新的在线算法，用于延迟学习（Learning-to-Defer, L2D）方法，旨在处理流式数据和动态专家可用性。该算法是首个用于具有多类分类、老虎机反馈和不同专家池的算法。它提供了理论遗憾保证，并在合成和真实世界数据集的实验中证明了其有效性，将L2D的能力扩展到更复杂、动态的环境中。

新框架优化LLM在抽取式问答中的使用

新的学习延迟方法利用专家建议和多专家协作

新框架提升单阶段延迟学习系统的对抗鲁棒性

新的在线算法增强了具有动态专家的延迟学习