实体
Esteban Garces Arias
Esteban Garces Arias
PulseAugur coverage of Esteban Garces Arias — every cluster mentioning Esteban Garces Arias across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新研究定义了大型语言模型中的“超拟合”,区别于温度缩放
一篇新的研究论文引入了“超拟合”的概念,即在小型数据集上微调大型语言模型可以出人意料地提高生成质量并减少重复。研究表明,这种效应与简单的温度缩放不同,并且涉及最后一个 Transformer 块内动态的、依赖于上下文的秩重排机制。研究人员还提出了“后期 LoRA”,一种仅针对最后五层进行微调的方法,以用更少的参数更新实现稳健的生成。
-
新的RDDG框架使用贝叶斯校准进行稀有关系数据合成
研究人员推出RDDG,一个旨在为不平衡数据集生成合成表格数据的新框架。该方法利用上下文学习和渐进式思维链过程来识别核心数据样本中的模式和相关性。RDDG的一个关键创新是其自增强反馈机制,该机制在整个合成过程中不断优化生成数据的质量。实验表明,RDDG在数据保真度和下游不平衡分类性能方面均优于现有方法。