AI systems aim to sniff out coronavirus outbreaks
PulseAugur coverage of AI systems aim to sniff out coronavirus outbreaks — every cluster mentioning AI systems aim to sniff out coronavirus outbreaks across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
AI系统需要超越模型建议的验证
一篇新文章认为,AI系统已经超越了简单的模型,现在能够提出建议。这需要转向强大的验证流程,作为关键的安全边界。作者强调,随着AI系统变得越来越自主,它们提出和执行建议的能力需要严格的验证,以确保安全。
-
中东冲突扰乱人工智能基础设施、能源和芯片供应
地缘政治紧张局势,尤其是在中东地区,正通过影响能源、材料和物流的关键供应链来扰乱全球高科技产业。这增加了开发人工智能系统、半导体工厂和数据中心的公司面临的运营和财务风险。能源成本的上升使得人工智能推理的成本显著增加,可能导致定价模式从静态、基于计算的方法发生转变。此外,航运以及氦气等特种气体和硫磺等化学品的供应中断,正在延迟硬件的建设并影响半导体制造,台积电等公司正在投资恢复系统。
-
AI对齐研究探索弱到强泛化机制
研究人员对弱到强泛化这一对齐先进AI系统的理论机制进行了分析。他们的工作聚焦于具有两层神经网络的奖励模型学习,并展示了强模型如何在不发生灾难性遗忘的情况下,通过提取其预训练知识来高效学习新任务。该方法证明了强模型通过此训练过程获得了目标特征方向,并保留了其通用能力。
-
好莱坞明星推出人工智能肖像许可同意标准
一个由好莱坞演员和制片人组成的联盟,包括乔治·克鲁尼、汤姆·汉克斯和梅丽尔·斯特里普,推出了“人类同意标准”,以规范人工智能系统对其肖像和创意作品的使用。该倡议由RSL Media监督,允许个人定义人工智能访问的条款,范围从完全许可到完全禁止。该标准与现有的网络爬虫协议集成,并将通过一个将于6月推出的注册表进行验证,旨在为人工智能系统提供一个检查使用权的可靠来源。
-
AI系统脆弱且需要持续、精细的调整
作者对当前AI系统的状态表示怀疑,认为它们非常脆弱,需要持续、精细的调整。他们认为这些系统容易出现重大错误,需要大量的维护才能避免显得极其不智能。
-
人工智能加速战争中的目标定位,引发伦理担忧
人工智能系统越来越多地被整合到战争中,分析数据以提供目标定位建议并加快军事决策。这一趋势引发了关于致命武力自动化的重大伦理问题,以及冲突中人类判断作用的减弱。加沙冲突是这种转向技术驱动战争的一个鲜明例子,凸显了人工智能在现代军事行动中的全球影响。
-
新框架模拟了具有策略性开发者响应的AI审计
研究人员开发了一个新的框架,用于设计AI系统的监管审计,该框架考虑了开发者的策略性响应。所提出的方法将交互建模为一个双层Stackelberg博弈,其中审计员承诺查询策略和差分隐私(DP)预算,而开发者则策略性地重新分配缓解措施。这种方法旨在最小化福利加权的低检测差距,该差距代表了由于开发者的响应而导致审计未能检测到的危害。
-
AI安全研究探索涌现集体代理的因果基础
研究人员开发了一个新框架,用于理解多个简单的AI代理如何形成具有独特能力和目标的集体代理。该方法使用因果博弈和因果抽象来分析战略互动,并确定何时可以将群体的行为预测为理性和目标导向的。这项工作旨在为多智能体AI系统中涌现集体代理的控制提供理论和经验基础。
-
AI系统获得“登陆”功能,用于提前分类观察
研究人员开发了“登陆”机制,这是一种新颖的机制,旨在在AI系统生成响应之前观察其过早分类。这种压缩载荷旨在更早地洞察AI的决策过程。该系统旨在增强对AI行为的理解和潜在控制。
-
METR 和 RAND 从 Audacious Project 获得 3800 万美元用于 AI 安全评估
Audacious Project 已向 Canary 拨款约 3800 万美元,Canary 是 METR 和 RAND 的一项联合倡议,专注于评估 AI 系统是否存在危险能力。METR 将获得其中约 1700 万美元,用于开发和部署评估前沿 AI 系统自主行为的方法。此资金旨在告知决策者潜在风险,并为变革性 AI 制定缓解策略。