multi-agent system · PulseAugur

MasFACT框架解决了多智能体LLM系统中的拓扑遗忘问题

研究人员推出MasFACT，一个旨在解决由大型语言模型驱动的持续多智能体系统（MAS）中“拓扑遗忘”问题的新型框架。当适应新任务导致系统丢失从先前任务中学到的有效通信结构时，就会出现此问题。MasFACT采用几何感知后验迁移方法，利用融合的Gromov-Wasserstein最优传输来保留历史协作知识作为可迁移的拓扑先验。然后，系统使用PAC-Bayes引导的适应来平衡学习新任务与维护稳定的通信结构。实验结果表明，与现有方法相比，Ma…

TOOL · CL_133519 · Jul 9 · 04:00

新框架AcMAS可检测基于LLM的多智能体系统中的隐蔽恶意行为

研究人员开发了AcMAS，一个旨在检测由大型语言模型（LLM）驱动的多智能体系统（MAS）中恶意行为的新框架。与依赖显式交互图和语义明显攻击的现有方法不同，AcMAS分析智能体激活空间内的内部推理状态。这种方法能够检测同步和异步MAS环境中的隐蔽攻击。此外，AcMAS可以帮助恢复受损智能体功能，相比于通常隔离受影响智能体的当前方法有所改进。

TOOL · CL_133302 · Jul 8 · 13:37

板载VLM赋能机器人多智能体控制系统

研究人员开发了一种用于机器人控制的多智能体系统（MAS）架构，该架构利用板载视觉语言模型（VLM）来克服可解释性、泛化性和计算需求的限制。该系统在紧凑型硬件上部署专用智能体，无需外部云计算。在模拟的工业仓库中进行了测试，该MAS成功地通过微调的VLM管理了安全检查、维护和响应人类请求等任务。引入了一种新颖的编排智能体“Megamind”，以解决小型模型在长时域规划中的上下文保留问题，证明了经济高效的板载解决方案在现实世界机器人应用中的可行性。

RESEARCH · CL_131127 · Jul 8 · 02:40

AI药物研发公司德睿智药完成5200万美元B轮融资

德睿智药是一家专注于AI驱动药物研发的公司，已成功完成5200万美元的B轮融资。此次融资将用于增强其AI药物开发引擎“分子艺术平台”（MAP）及其多智能体系统和临床数据整合能力。此外，资金还将支持其自主研发的口服GLP-1RA药物MDR-001的III期临床开发和商业化，并拓展其创新药物管线。

SIGNIFICANT · CL_119871 · Jul 1 · 03:35

Kimi K2.6 模型利用多智能体系统构建 macOS 原型

最近对 Kimi K2.6 模型（针对多智能体系统进行了优化）的一次测试表明，该模型能在 53 分钟内自主开发出一个基于浏览器的 macOS 原型。该模型成功地将复杂任务分解为不同的模块，为六个模拟智能体分配了角色，并管理了一个包括规划、编码、反思和迭代的开发周期。尽管遇到了依赖项安装失败等错误，K2.6 仍调整了策略以继续执行任务，展示了应对复杂软件工程挑战的强大能力。

RESEARCH · CL_119452 · Jun 30 · 17:16

TreeAgent 使用多智能体系统和 VLM 自动化林业偏倚标注

研究人员开发了 TreeAgent，这是一个新颖的多智能体系统，旨在利用专家规则和视觉语言模型 (VLM) 自动化林业偏倚标注。该框架将专家决策树与 VLM 集成以实现本地化感知，并采用多智能体投票来提高可靠性。该系统利用解耦声明式决策 (D3) 框架在不同专家结构之间实现泛化，显著减少了手动专家标注的需求，同时保持了可解释性。

RESEARCH · CL_117251 · Jun 29 · 17:40

新的MESA框架优先考虑多智能体系统中易受攻击的通道

研究人员开发了MESA，一个旨在主动识别和优先考虑多智能体系统（MAS）中最易受攻击的通信通道的新框架。该方法旨在通过关注关键节点来优化有限的安全资源，这些节点如果被破坏，可能会严重影响系统的整体成功。MESA利用图论指标和动态探测的组合，无需先验攻击数据即可对这些关键节点进行排名。在各种MAS场景和LLM上的评估表明，MESA的排名与实际攻击成功率高度相关，使防御者能够比随机分配拦截更多的攻击。

TOOL · CL_129607 · Jun 29 · 16:51

新的ANTAP架构使用实证测试来保护多智能体系统

研究人员开发了ANTAP，一种新颖的多智能体系统路由架构，它使用主动能力测试而非文本自我描述等间接代理。这种由评估驱动的方法通过实证确定智能体能力，将性能提炼为固定的行为算子。通过非文本代数投影执行路由，ANTAP建立了一个“语言防火墙”，可以防止基于元数据的攻击，并与传统方法相比显著降低了对抗性成功率。

RESEARCH · CL_117126 · Jun 29 · 16:51

新的ANTAP系统为多智能体AI路由创建“语言防火墙”

研究人员开发了ANTAP（自动非文本智能体选择器），一种新颖的多智能体系统路由架构，通过超越文本描述等间接代理来增强安全性。ANTAP采用主动能力测试来实证确定智能体能力，将性能提炼为固定的行为算子。这种方法创建了一个“语言防火墙”，可以防止基于元数据的攻击，在针对基于描述的注入攻击时实现近乎零的自动语音识别（ASR），并且与基线方法相比，在针对自适应嵌入攻击时ASR降低了20%。

TOOL · CL_109538 · Jun 24 · 09:31

AI智能体在IT合规性审计中展现潜力，但面临确定性严谨性挑战

研究人员开发了一种多智能体系统（MAS）架构，并结合混合检索增强生成（HybridRAG）技术，以部分自动化德国IT-Grundschutz（IT-GS）认证流程。该系统旨在减少合规性标准（如IT-GS）所需的巨大人工投入，而IT-GS标准是NIS-2等指令强制要求中小型企业遵守的。MAS架构包含一个假设-验证循环以减少幻觉，以及一个解耦推理管道以分离语义提取和保护需求继承。虽然该系统在结构分析和建模阶段的信息提取等语义任务中表现出高…

RESEARCH · CL_102451 · Jun 21 · 09:48

Designarena 开发真实世界设计基准；Frontier Ai 研究揭示复杂的 AI 通信

Designarena 正在开发一个新的设计基准，以评估真实世界的设计任务和前端性能，旨在通过利用超过 400 万创作者的数据，提供比基于文本的基准更实用的比较。另外，Frontier Ai 的研究正在探索零样本语言习得、人类难以解释的复杂自编码方案，以及 AI 代理通信中可利用的秘密通道的可能性。

RESEARCH · CL_106262 · Jun 20 · 17:13

玻利维亚因致命道路封锁宣布进入紧急状态

玻利维亚总统 Rodrigo Paz 已宣布进入为期 90 天的紧急状态，授权军队清除广泛的道路封锁。这些封锁由反对紧缩措施和取消燃油补贴的抗议活动引发，已导致燃料和食品供应严重中断，造成至少 37 人受伤和 17 人死亡，许多人因缺乏医疗护理而死亡。紧急措施旨在恢复秩序并确保基本供应，同时 Paz 总统试图应对来自右翼反对派和前执政党支持者的政治压力。

TOOL · CL_100642 · Jun 19 · 12:31

LangGraph 推出多智能体系统以应对 AI 认知过载

文章介绍了 LangGraph 框架内的多智能体系统概念，作为解决单一智能体系统因拥有众多工具而面临的认知过载问题的方案。文章解释说，通过将复杂任务分配给专门的智能体，可以提高性能，并通过并行处理解决顺序瓶颈。最简单的多智能体模式——主管模式——得到了详细介绍，其中主管智能体将请求路由给专家智能体，类似于律师事务所合伙人与助理的运作方式。

TOOL · CL_104639 · Jun 18 · 19:08

专家型与通才型AI代理：性能权衡的探讨

一篇新论文探讨了人工智能集体（即多个代理为共同任务协作的系统）的性能。研究人员发现，这些集体的设计，特别是狭窄能力专家型代理和广泛能力通才型代理之间的平衡，显著影响了它们的有效性。通才型集体在涉及生成和协调的任务上表现出色，而具有一些通才型中介的专家型集体更适合谈判任务。该研究还强调，代理的计算限制（如理性界限）如何进一步影响这些性能权衡，表明最优的多代理系统设计需要将网络结构与任务需求和代理能力相匹配。

TOOL · CL_98787 · Jun 18 · 13:03

使用双代理 LLM 管道和故障转移构建自托管 RAG 聊天机器人

本文详细介绍了如何构建一个自托管的检索增强生成（RAG）聊天机器人，该机器人旨在根据受控知识库提供准确的答案。该系统采用双代理管道进行不同的推理步骤：一个代理负责选择检索工具和参数，第二个代理负责将检索到的信息提炼成最终的、有依据的答案。一个关键特性是自动故障转移机制，当主模型不可用或受到速率限制时，该机制会自动切换到备用 LLM，确保查询的连续性。

TOOL · CL_98291 · Jun 18 · 06:02

TechCirkle 提供企业级生成式AI开发服务

TechCirkle 提供生成式AI开发服务，帮助企业超越基础API使用，构建安全、定制化的AI生态系统。他们的方法侧重于通过实施检索增强生成（RAG）、具有智能逻辑的多代理系统以及低延迟前端架构来解决企业面临的数据主权、上下文窗口限制和系统幻觉等挑战。这些服务旨在创建专有的认知中心，确保关键业务运营的数据准确性和合规性。

TOOL · CL_95773 · Jun 16 · 15:38

新的智能熵原理旨在稳定AI代理系统

研究人员引入了智能熵原理，一种新的理论，认为概率驱动的系统，例如由大型语言模型驱动的多代理系统（MAS），会随着时间的推移而自然退化。为了抵消这种影响，他们开发了ADE（Agent Delivery Engineering）框架，这是一个四层系统，旨在稳定MAS行为。该框架通过广泛的实验和生产监控得到验证，显著降低了系统故障和系统崩溃的概率。

RESEARCH · CL_95774 · Jun 16 · 14:13

神经符号框架利用LLM增强AI策略综合

研究人员开发了一种新颖的神经符号框架，将大型语言模型（LLM）集成到多智能体系统（MAS）的模型检查过程中。该方法使用LLM作为策略生成预言机，提出候选策略，然后由MAS模型检查器进行形式化验证。使用Qwen3-32B模型的实验表明，这种生成-认证架构在一个包含4211个NatATL实例的新数据集上，在策略综合结果方面达到了92%的准确率。

RESEARCH · CL_95775 · Jun 16 · 13:34

新的LLM编排多智能体框架增强BDaaS生命周期自动化

研究人员开发了一个新的大数据即服务（BDaaS）框架，该框架利用由中央LLM编排的多智能体系统。该系统旨在自动化和提高从摄取到部署后监控和漂移检测的整个数据工程和MLOps生命周期的可靠性。与现有的单智能体或仅AutoML方法相比，所提出的架构将任务分解为专门的智能体，增强了生命周期级别的编排、工件治理和人工监督。

RESEARCH · CL_93586 · Jun 15 · 13:40

研究：AI智能体系统中虚假信息传播

一篇新的研究论文探讨了良性多智能体系统中虚假信息传播的风险，特别是那些利用大型语言模型的系统。研究发现，注入虚假信息会降低单智能体和多智能体设置的性能，并且错误会通过智能体交互持续存在。然而，与单智能体提示相比，多智能体辩论可以在一定程度上缓解这种退化，具体取决于所使用的群体构成和决策协议。