PulseAugur
实时 03:05:36
实体 SWE-Agent

SWE-Agent

PulseAugur coverage of SWE-Agent — every cluster mentioning SWE-Agent across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_44132 ·

    Alibaba的Qwen3-Coder-Next在SWE-Bench上取得70.6分,采用稀疏MoE架构

    阿里巴巴的Qwen3-Coder-Next是一个拥有800亿总参数、30亿激活参数的模型,在SWE-Bench Verified基准测试中取得了70.6分。这一成绩尤为引人注目,因为它在提供可下载的Apache 2.0许可权重的同时,能够媲美顶级的闭源模型。该模型采用了稀疏混合专家(MoE)架构和混合注意力机制,结合了用于长上下文的线性注意力与用于全局上下文重建的标准注意力。

  2. TOOL · CL_44745 ·

    Code Researcher 代理将 Linux 内核崩溃解决率提高了 48%

    一种名为 Code Researcher 的新型深度研究代理已被开发出来,通过分析大型代码库及其提交历史来解决复杂的系统代码问题。该代理在 kBenchSyz 等基准测试中的表现显著优于现有方法,使用 GPT-4o 达到了 48% 的崩溃解决率,使用 Gemini 2.5-Flash 甚至达到了更高的解决率。该研究强调了收集广泛的全局上下文和采用多方面推理对于在大型系统中进行有效代码修改的关键作用。