PulseAugur
实时 09:06:49
实体 Tree-like Self-Play (TSP)

Tree-like Self-Play (TSP)

PulseAugur coverage of Tree-like Self-Play (TSP) — every cluster mentioning Tree-like Self-Play (TSP) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68364 ·

    新的 LLM 技术通过从错误中学习来增强安全代码生成

    研究人员开发了一个名为树状自我博弈 (TSP) 的新框架,以提高大型语言模型 (LLM) 生成代码的安全性。TSP 将代码生成重新构建为顺序决策过程,使模型能够探索安全和易受攻击的代码路径。这种方法使 LLM 能够从细粒度的自身错误中学习,从而实现更强大的安全性。