Yannis Montreuil
PulseAugur coverage of Yannis Montreuil — every cluster mentioning Yannis Montreuil across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
新框架优化LLM在抽取式问答中的使用
研究人员开发了一个学习延迟(Learning-to-Defer)框架,以提高使用大型语言模型(LLM)进行抽取式问答(EQA)的效率。该方法智能地将查询分配给专用模型,确保高置信度的预测,同时最大限度地降低计算成本。该框架在SQuADv1和TriviaQA等数据集上进行了测试,证明了其提高了答案的可靠性并显著降低了计算开销,使其适用于可扩展的EQA部署。
-
新的学习延迟方法利用专家建议和多专家协作
研究人员开发了新的“学习延迟”(L2D)系统方法,该系统决定是进行预测还是咨询专家。最新的进展通过允许系统不仅选择专家,还为该专家提供额外的、特定于上下文的信息,从而解决了现有框架中的局限性。新方法还将L2D扩展到同时利用多个专家,使系统能够查询成本效益最高的k个实体或根据输入难度调整专家数量。
-
新框架提升单阶段延迟学习系统的对抗鲁棒性
研究人员开发了一个新框架,以增强单阶段延迟学习(L2D)系统的对抗鲁棒性。该方法解决了 L2D 模型中的漏洞,这些模型可能被对抗性扰动操纵,从而改变预测和延迟决策。提出的方法包括形式化攻击、引入成本敏感的对抗性代理损失,并为分类和回归任务提供理论保证。实验表明,在保持干净数据性能的同时,针对各种攻击的鲁棒性得到了提高。
-
新的在线算法增强了具有动态专家的延迟学习
研究人员开发了一种新的在线算法,用于延迟学习(Learning-to-Defer, L2D)方法,旨在处理流式数据和动态专家可用性。该算法是首个用于具有多类分类、老虎机反馈和不同专家池的算法。它提供了理论遗憾保证,并在合成和真实世界数据集的实验中证明了其有效性,将L2D的能力扩展到更复杂、动态的环境中。