PulseAugur
实时 13:29:37
实体 FEM-Bench

FEM-Bench

PulseAugur coverage of FEM-Bench — every cluster mentioning FEM-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_36289 ·

    新研究解决大语言模型评估、训练和推理效率问题

    研究人员正在开发新的方法来改进大语言模型(LLM)的评估和训练。一种名为SCOPE的方法校准大语言模型裁判,以确保在可控错误率下的可靠成对评估。另一种技术D3使用动态影响图,通过考虑样本交互来优化大语言模型训练期间的数据调度。此外,OBCache提供了一个原则性的框架来修剪键值缓存,以减少长上下文推理期间的内存开销,从而提高准确性。