实体 FEM-Bench

FEM-Bench

PulseAugur coverage of FEM-Bench — every cluster mentioning FEM-Bench across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_36289 · May 28 · 00:00

新研究解决大语言模型评估、训练和推理效率问题

研究人员正在开发新的方法来改进大语言模型（LLM）的评估和训练。一种名为SCOPE的方法校准大语言模型裁判，以确保在可控错误率下的可靠成对评估。另一种技术D3使用动态影响图，通过考虑样本交互来优化大语言模型训练期间的数据调度。此外，OBCache提供了一个原则性的框架来修剪键值缓存，以减少长上下文推理期间的内存开销，从而提高准确性。