PulseAugur
实时 13:32:46
实体 Online Agent-as-a-Judge

Online Agent-as-a-Judge

PulseAugur coverage of Online Agent-as-a-Judge — every cluster mentioning Online Agent-as-a-Judge across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_41763 ·

    AI 代理通过新的 RAG、模拟和合规性工具取得进展

    研究人员正在开发先进的代理框架,以提高各种领域的 AI 可靠性和效率。Google 推出了 agentic RAG 系统,通过迭代搜索完整上下文来增强企业查询处理能力,准确率最高可提高 34%。Hugging Face 使用一个小型 3B 模型演示了多代理经济模拟,突显了模型大小与实时性能之间的权衡。其他研究探索了可靠的工具使用方法、通过代理间协议实现的监管合规性、代理行为的动态基准测试以及 AI 代理的稳健自我演化机制。