实体 CAISI

CAISI

PulseAugur coverage of CAISI — every cluster mentioning CAISI across labs, papers, and developer communities, ranked by signal.

总计 · 30天

11

90 天内 11

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

significant 1
research 1
tool 6
commentary 3

主题

关系

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 11 条

RESEARCH · CL_86383 · Jun 11 · 21:27

DARPA启动AI Forge计划以应对国家安全挑战

DARPA-NSF-CAISI AI Forge计划正在启动其下一阶段，重点关注国家安全的关键AI挑战。该计划将发布一份详细说明这些挑战的报告，报告的制定汇集了顶尖AI公司和政府官员的意见。此外，DARPA已向美国大学发布了信息征询书（RFI），邀请他们提出研究项目建议，项目金额从75万美元到300万美元不等，以满足国家安全AI的需求。
TOOL · CL_84598 · Jun 11 · 03:25

DeepSeek V4 在编码方面表现出色，但在通用推理方面滞后

DeepSeek V4 的编码性能异常出色，在 SWE-bench 和 LiveCodeBench 等基准测试中取得了最高分。然而，CAISI 的评估表明，其通用推理和智能体能力明显落后于前沿模型，大约滞后八个月。这种差异凸显了针对编码任务的专门优化可能无法转化为更广泛的 AI 能力，并且在使用量化或小型模型版本进行本地部署时，性能差距可能会进一步扩大。
COMMENTARY · CL_71437 · Jun 4 · 15:48

Anthropic发布Claude Opus 4.8；美国发布新的AI行政命令

Anthropic发布了Claude Opus 4.8，这是对其前代产品的一次渐进但显著的改进，作者现在将其用作日常工具。美国政府重新发布了一项关于AI的行政命令，该命令对前沿模型的发布引入了事先限制措施，但有关NSA的参与和分类测试程序的细节引起了担忧。OpenAI还提出了一个新的政策蓝图，该蓝图被认为非常出色，这与他们一些不太道德的政治运作形成了对比。
SIGNIFICANT · CL_69297 · Jun 3 · 10:00

OpenAI 提议联邦人工智能安全框架，关注递归自我改进

OpenAI 发布了公共政策议程和联邦前沿人工智能治理框架蓝图。该文件强调安全、青少年保护和全球标准的需求，同时解决人工智能系统日益增长的递归自我改进（RSI）挑战。OpenAI 建议授权 CAISI 等机构对最强大的模型进行评估和缓解建议，倡导透明度并保持美国的计算优势。
RESEARCH · CL_52896 · May 26 · 12:00

DeepSeek 寻求 1.6 万亿美元融资以支持高效 AI 硬件生态系统

中国人工智能公司 DeepSeek 据报道正在进行一项重大的融资谈判，金额约为 700 亿元人民币（约合 1.6 万亿美元）。该公司因发布开源模型 DeepSeek-V4-Pro 而获得认可，该模型已被美国政府的 CAISI 评估为性能可与 GPT-5 相媲美，尽管有八个月的滞后。DeepSeek 的战略似乎侧重于极致效率，特别是在其 KV 缓存实现方面，这大大减少了内存使用和计算需求，即使在性能较低的硬件上也能实现具有竞争力的性能。…
RESEARCH · CL_34816 · May 16 · 17:00

开源模型落后于前沿闭源模型，基准测试存在争议

多家领先的 AI 实验室发布了新的开源模型，包括 DeepSeek V4、Gemma 4、Kimi K2.6 和 MiMo 2.5。CAISI 的一项评估表明，这些开源模型落后于前沿闭源模型，且差距正在扩大。然而，评估方法和基准测试的局限性也引发了争议，一些人认为标准化测试未能完全捕捉实际能力，尤其是在编码等复杂任务中。
TOOL · CL_28417 · May 12 · 11:00

NIST：DeepSeek V4 Pro性能比肩GPT-5，领先中国模型

美国国家标准与技术研究院（NIST）评估了中国公司DeepSeek推出的新人工智能模型DeepSeek V4 Pro。评估发现，DeepSeek V4 Pro的性能与大约八个月前发布的OpenAI的GPT-5相当。尽管存在这一滞后，DeepSeek V4 Pro仍创下了迄今为止中国自主研发的人工智能模型的最高评分，超越了之前的顶级模型如Kimi K2.5。值得注意的是，NIST的报告还强调了DeepSeek V4 Pro与美国同类人工…
COMMENTARY · CL_26547 · May 11 · 12:46

研究人员称AI监管应保留未来选项

研究人员提出将“激进选择性”作为AI的监管方法，建议政府现在就投资工具和机构来应对未来的颠覆。该策略强调建立信息收集能力、举报人保护和灵活的定义，而不是立即采取僵化的监管措施。目标是为民主政府在情况不断变化时，就具有变革性的AI系统做出明智决策的能力保留空间，即使这需要前期的大笔投资且回报不确定。
RESEARCH · CL_16707 · May 5 · 12:00

NIST 与 Google DeepMind、Microsoft 和 xAI 合作进行前沿人工智能安全测试

美国国家标准与技术研究院的人工智能标准与创新中心 (CAISI) 已与 Google DeepMind、Microsoft 和 xAI 正式签署了新的协议。这些合作旨在加强前沿人工智能模型在公开发布前的安全测试。CAISI 将进行部署前评估和有针对性的研究，以评估先进的人工智能能力及其对国家安全的影响，并在此基础上进一步深化先前的合作关系。
SIGNIFICANT · CL_00119 · Feb 17 · 12:00

NIST启动人工智能代理标准倡议，促进安全、互操作性创新

美国国家标准与技术研究院（NIST）已启动人工智能代理标准倡议，以促进自主人工智能代理的安全和互操作性采用。该倡议由NIST的人工智能标准与创新中心（CAISI）牵头，旨在促进行业主导的标准和开源协议。重点领域包括推进人工智能代理安全和身份方面的研究，以建立公众信任并确保美国在全球人工智能格局中的领导地位。
COMMENTARY · CL_02317 · Aug 12 · 00:00

OpenAI敦促加州与联邦标准协同，引领AI监管

OpenAI已敦促加州州长Gavin Newsom将州级AI监管与国家和全球标准统一，以促进创新和安全。该公司倡导一种统一的方法，建议遵守联邦协议（如与AI标准与创新中心（CAISI）的协议）应足以满足州级要求。OpenAI还强调需要豁免小型开发者免受繁重监管，以维持充满活力的AI生态系统，并确保美国在民主AI发展中的领导地位。