实体
Mind2Web
Mind2Web
PulseAugur coverage of Mind2Web — every cluster mentioning Mind2Web across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的LLM代理SkillMigrator通过布局匹配重用网络技能
研究人员开发了SkillMigrator,这是一种新颖的方法,用于大型语言模型(LLM)网络代理在不同网站之间重用技能。与依赖指令相似性或站点元数据的先前方法不同,SkillMigrator基于页面布局结构匹配可迁移交互模式(TIPs)。这使得代理能够通过识别相似的结构布局在新页面上巩固技能,从而在WebArena和Mind2Web等基准测试中将LLM操作计数减少8-10%。
-
FluxMem框架通过演进式图拓扑增强LLM代理的记忆
研究人员推出FluxMem,一个旨在增强LLM代理在动态环境中能力的全新记忆框架。与传统的静态记忆系统不同,FluxMem将记忆建模为一个持续演进的异构图。该框架通过三个阶段精炼其拓扑:初始连接、反馈驱动调整和长期巩固。FluxMem在LoCoMo、Mind2Web和GAIA等基准测试中展示了最先进的性能,展示了代理任务适应性和泛化能力的提高。相关代码将开源。