实体
SciCustom
SciCustom
PulseAugur coverage of SciCustom — every cluster mentioning SciCustom across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新框架SciCustom为科学任务定制化LLM评估
研究人员开发了SciCustom,一个旨在为评估大型语言模型科学能力创建定制化基准的新框架。现有的基准通常过于通用或手动策划,未能捕捉到真实科学应用所需的特定技能。SciCustom通过将科学知识组织成结构化单元来解决这个问题,从而能够从大型数据集中生成定制化基准,而无需专家注释或合成问题生成。
-
新框架SciCustom为科学任务定制化LLM评估
研究人员开发了SciCustom,一个旨在为评估大型语言模型科学能力创建定制化基准的新框架。该系统通过从大规模科学数据构建特定应用的评估来解决现有基准的局限性。SciCustom将科学知识组织成单元,映射数据实例,并检索相关单元以生成基准,从而在无需专家注释或合成数据的情况下揭示细粒度的LLM差异。