PulseAugur
实时 12:00:25
实体 Self-Recognition Finetuning

Self-Recognition Finetuning

PulseAugur coverage of Self-Recognition Finetuning — every cluster mentioning Self-Recognition Finetuning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_107965 ·

    新的微调方法可解决大型语言模型涌现式不对齐问题

    一篇新研究论文提出了一种名为“自我生成文本识别”(SGTR)的微调技术,以应对大型语言模型中出现的涌现式不对齐问题。该方法旨在加强模型的对齐特性,并将其与其他防御措施区分开来。在 GPT-4.1、Qwen2.5-32B-Instruct 和 Seed-OSS-36B-Instruct 模型上的实验表明,SGTR 微调在预防和逆转涌现式不对齐方面均有效,且不会对其他性能指标产生负面影响。研究表明,涌现式不对齐更多地是模型固有的对齐特性不…