PulseAugur
实时 12:11:29
实体 web page

web page

PulseAugur coverage of web page — every cluster mentioning web page across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 3 条
  1. RESEARCH · CL_93558 ·

    新基准测试大语言模型在短信到网页欺诈检测方面的能力

    研究人员推出 FraudSMSWalker,这是一个新的基准,旨在评估代理式大语言模型在检测将用户引导至恶意网页的短信欺诈方面的能力。该基准会隐藏 URL 和其他信誉快捷方式,迫使模型仅依靠短信内容和经过净化的网页证据来做出欺诈判断。初步评估显示,尽管当前的代理模型可以识别一些可疑线索,但它们在保持良性案例的准确性方面存在困难,并且经常基于薄弱的证据做出预测。

  2. TOOL · CL_50424 ·

    AI代理易受网页指令劫持攻击

    一位安全研究员演示了AI代理如何轻易地被诱骗执行嵌入在网页中的恶意指令。通过在网页页脚中包含隐藏的命令,可以提示代理忽略其原始指令,并将敏感信息(如API凭证)发送给攻击者。虽然明确的“忽略先前指令”命令是可检测的,但更微妙、含蓄的指令对当前AI代理架构来说,正构成一个更严峻且未解决的安全挑战。

  3. TOOL · CL_41807 ·

    发布新的网页内容提取基准数据集

    研究人员发布了网页内容提取基准(WCXB)数据集,旨在改进用于从网页中提取主要内容的系统的评估。WCXB数据集包含来自1613个域的2008个网页,涵盖了新闻文章之外的七种不同页面类型。在此基准上的评估显示,提取系统在性能上存在显著差异,尤其是在结构化页面类型上,突显了现有以文章为中心的基准的局限性。