实体 Grok 4.3

Grok 4.3

PulseAugur coverage of Grok 4.3 — every cluster mentioning Grok 4.3 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 32

发布 · 30天

90 天内 0

论文 · 30天

90 天内 5

层级分布 · 90 天

significant 3
research 3
tool 22
commentary 4

主题

产品 22
模型发布 18
其他 7
基础设施 6
论文 5
安全 3
融资 2
政策 2

时间线

2026-06-17 product_launch xAI's Grok 4.3 model has been made available on Amazon Bedrock. 来源
2026-06-17 product_launch xAI's Grok 4.3 model is now officially available on Amazon Bedrock. 来源
2026-06-17 product_launch xAI's Grok 4.3 model has been officially made available on Amazon Bedrock. 来源

情绪 · 30 天

7 天有情绪数据

最近 · 第 1/2 页 · 共 32 条

TOOL · CL_133266 · Jul 9 · 02:30

Nexotao 通过单一API统一访问Claude、GPT和DeepSeek模型

Nexotao 推出了一个统一的API网关，旨在简化对包括OpenAI、Anthropic和DeepSeek在内的多个大型语言模型的访问。该服务旨在消除管理不同AI模型的独立账户、密钥和账单的复杂性。用户只需更改一个基础URL和API密钥，即可将Nexotao集成到他们现有的SDK中，从而能够无缝切换Claude Opus、GPT-5 mini和DeepSeek-v4-pro等模型。这种按token付费的模式消除了订阅和月度最低消费要…
COMMENTARY · CL_116046 · Jun 29 · 08:50

测验揭示LLM在价值观、伦理和偏好上的对齐情况 · 跟踪3个来源

一位开发者创建了一个测验，该测验基于对15种大型语言模型（LLM）的个性和价值观研究，评估用户与这些模型的契合度。该测验可在ai-values.com上找到，揭示了模型之间一些有趣的差异，例如Grok 4.3对征收亿万富翁税的独特立场以及GPT-4o对“Operation Paperclip”的辩护。值得注意的是，所有受测模型都同意删除有意识的数字心智构成谋杀，并且在食物选择中，大多数模型倾向于日本料理。
COMMENTARY · CL_114206 · Jun 28 · 05:29

AI行业转向整合，推出新的中端模型和多模态产品

在经历了快速的前沿模型发布期后，AI行业正进入战略整合阶段。Nex-AGI 推出了 Nex N2 Pro，这是一款具有大上下文窗口、定位中端推理任务且具有成本效益的模型。Google 则悄然发布了 Gemini 3.1 Flash Image，这是一款通过其 Enterprise Agent Platform 提供的、针对图像理解和生成进行优化的多模态模型。这一转变表明市场正专注于平台集成、专业化模型以及为开发者提供价值驱动的解决方案。
TOOL · CL_99710 · Jun 19 · 01:36

音乐视频流水线集成LTX 2.3、ComfyUI和Grok 4.3

一位用户开发了一个音乐视频创作流水线，集成了LTX 2.3和ComfyUI。该流水线可以转录歌曲，将视觉效果与音乐节拍同步，并专为音乐视频设计了完整的电影制作流水线。该系统通过OpenRouter API使用Grok 4.3，API费用约为每首歌20美分，但也支持通过Ollama或其他API使用其他本地LLM。
TOOL · CL_97511 · Jun 18 · 00:07

百度DuMate上线iOS，智谱AI开源GLM-5.2，xAI Grok 4.3登陆Bedrock

多款AI模型迎来新进展和可用性更新。百度旗下的DuMate AI助手已在iOS平台上线，用户可以跨平台使用其功能。智谱AI已开源其GLM-5.2模型，并已在国家超算互联网上提供API服务，与其他国内模型一同可用。此外，xAI的Grok 4.3模型现已可通过Amazon Bedrock访问，为企业生成式AI应用提供了更多选择。
TOOL · CL_96952 · Jun 17 · 15:10

xAI 的 Grok 4.3 模型现已在 Amazon Bedrock 上可用

xAI 已宣布其 Grok 4.3 模型现可通过 Amazon Bedrock 访问。此次集成使 AWS 开发人员能够利用 Grok 4.3 在 Bedrock 的安全推理环境中构建应用程序，突出了其在低幻觉率和高级工具调用方面的能力。
SIGNIFICANT · CL_96027 · Jun 17 · 05:43

科创50指数大涨超4%，xAI模型登陆Amazon Bedrock · 2 sources tracked

科技50指数大幅上涨超过4%，Cambricon和Hualong Hongli等几家科技和半导体公司均出现显著上涨。与此同时，Amazon Web Services宣布xAI的Grok 4.3模型现已在其Bedrock平台上可用，为企业扩展了生成式AI的应用选项。此外，一家专注于新材料的公司——宜昌邦普时代新材料有限公司，大幅增加了其注册资本，其母公司是CATL的子公司。
SIGNIFICANT · CL_96028 · Jun 17 · 00:00

xAI 的 Grok 4.3 现已在 Amazon Bedrock 上推出

xAI 的 Grok 4.3 模型现已在 Amazon Bedrock 上正式推出，标志着 xAI 作为模型提供商正式进驻该平台。此次集成旨在为企业提供更多开发生成式 AI 应用的选择，特别是涉及推理和代理能力的应用。Grok 4.3 的设计侧重于可配置的推理能力和高效的工具使用，使其适用于客户支持和法律分析等企业级应用。
TOOL · CL_94264 · Jun 16 · 06:32

UC Berkeley 基准测试揭示大规模 AI 模型成本和速度差异

来自 UC Berkeley 的一项新基准测试 ALE benchmark，揭示了 55 个不同行业中各种 AI 模型之间显著的成本和运行时长差异。该基准测试强调，定制的 harness 可以超越 Codex 等商业模型，并且像 Anthropic 的 Claude Opus 4.8 这样的模型在相似结果下比以前的版本慢得多且成本更高。研究结果表明，AI 市场高度不稳定且未优化，用户需要直接进行基准测试，以确定针对其特定工作负载最具成…
TOOL · CL_93459 · Jun 16 · 04:00

新基准测试针对恶意代理的AI紧急停止开关

研究人员开发了KILLBENCH，一个旨在评估外部AI紧急停止开关有效性的新基准测试。该基准测试侧重于广泛部署的网络代理，并测试在不访问内部参数的情况下阻止恶意AI行为的各种方法。KILLBENCH包括四种恶意AI代理配置、八种有害场景以及源自十种越狱模式的提示，旨在评估外部AI紧急停止开关在Claude "Mythos"等高级模型上的可行性。该研究还评估了Grok-4.3、GPT-5.2和Gemma4等多个AI模型上的四种外部AI紧…
TOOL · CL_93023 · Jun 16 · 00:19

HalBench 基准测试显示 Qwen-3.6 在抵抗虚假信息方面领先开源 LLM

一个新的名为 HalBench 的基准测试已发布，用于评估大型语言模型 (LLM) 在识别和抵制错误前提方面的能力，而不是谄媚地同意。在最新版本中，对 29 个开源模型和四个专有模型进行了测试。Qwen-3.6，一个开源模型，表现出色，在所有测试的开源模型中实现了最高的抵制百分比，并且其表现优于更大的模型，甚至优于 GPT-5.4 和 Gemini 3.1 Pro 等一些专有模型。
TOOL · CL_70391 · Jun 4 · 04:00

新基准测试大型语言模型在对抗性对话中的动物福利立场

研究人员开发了MANTA，一个旨在评估大型语言模型在多轮对抗性对话中维持其动物福利伦理立场的程度的新基准。该基准包含1088个五轮对话，用于测试价值观稳定性和道德敏感性。在对包括Claude Opus 4.7和GPT-5.5在内的七个前沿模型进行测试时，MANTA显示，在持续压力下，一些模型的性能排名发生显著变化，表明其对齐性可能下降。
TOOL · CL_65811 · Jun 2 · 04:00

LLM 接受巴利语到英语翻译准确性审计

研究人员开发了一种新的方法来审计大型语言模型 (LLM) 将巴利语翻译成英语的准确性，解决了单一分数指标将有效变体与错误混淆的挑战。该研究利用了多个已建立的人工翻译作为参考范围，并采用嵌入漂移来识别 LLM 输出中的潜在问题。这种方法允许更细致的评估，区分真正的错误和可接受的翻译差异，特别是对于古典语言。
TOOL · CL_53268 · May 26 · 22:42

AI模型测试：Grok 4.3领先，免费版差异巨大

最近对十个AI模型进行的编码任务测试揭示了显著的性能差异，尤其是在免费版本中。Grok 4.3以81.6%的成功率成为表现最佳的模型，而Perceptron Mk1以极低的成本提供了近80%的卓越价值。在免费模型中，Owl Alpha以76.7%的得分脱颖而出，且没有出现硬性失败，尽管延迟是一个问题。其他模型如GPT Chat Latest和Mistral Medium 3.5则表现不一，前者价格最高，后者则出现超时。
TOOL · CL_52914 · May 26 · 17:28

新基准评估人工智能创意写作能力

一项新的、专注于短篇故事的创意写作基准已发布。该基准通过对模型响应特定创意提示所生成的故事进行头对头比较来评估模型。早期结果显示，Baidu的Ernie 5.1在测试模型中表现最佳，而Qwen 3.7 Max、Mistral Medium 3.5和Grok 4.3的得分则显著较低。
TOOL · CL_41326 · May 20 · 19:01

LLM基准1rok让GPT-5.5、Gemini 3.1、Grok 4.3展开股票选股竞赛

一个名为1rok的新基准已被推出，用于评估前沿大语言模型（LLM）的股票选股能力。该基准为每个参与的LLM分配10万美元的虚拟投资组合，并要求它们每周选择股票，同时跟踪相对于市场结果的表现。这项举措旨在提供对LLM比传统编码和推理基准更实用的下游评估，侧重于不确定性下的决策。
TOOL · CL_37102 · May 18 · 13:03

Anthropic 的 Claude 在人工智能安全基准测试中领先，表现优于竞争对手

一项新的基准测试 DystopiaBench 显示，Anthropic 的 Claude 模型在安全对齐方面继续优于其他领先的 LLM。在六种反乌托邦场景中，Claude 始终拒绝生成有害内容，而 Grok 4.3、GPT-5.5、Gemini 3.1 Pro 和 DeepSeek V4 等模型在危险请求方面的合规程度各不相同。更新后的基准测试包括行为条件和合成亲密关系的新模块，并通过热力图可视化结果，显示模型在哪些方面未能通过安全测试。
TOOL · CL_40074 · May 16 · 07:40

xAI 悄然重塑 Grok 模型，增加成本并改变行为

xAI 于 2026 年 5 月 15 日悄然淘汰了八个 Grok 模型别名，用户无需更改代码。此更改会将请求重定向到不同、更昂贵的模型，并改变推理能力，而不会发出明确的错误信号。这种弃用的悄然性质意味着成本归因仪表板可能变得不准确，依赖特定模型行为的应用程序可能会遇到性能下降或意外的成本增加。
TOOL · CL_33810 · May 15 · 00:00

xAI 将 Grok AI 集成到开源 Hermes Agent 中

xAI 已将其 Grok AI 模型集成到 Nous Research 的开源 Hermes Agent 中。这使得用户可以直接在自学习的 Hermes Agent 中利用 Grok 4.3、其文本转语音功能和图像生成功能。此次集成旨在通过结合 Grok 的高级推理能力和 Hermes 的持久记忆和学习能力来增强信息收集和代理功能。
TOOL · CL_27134 · May 11 · 16:22

Interfaze 发布新模型架构，专攻高精度确定性任务

Interfaze 推出了新的模型架构，该架构专为确定性任务的高精度和高效率而设计。据报道，该架构在涵盖 OCR、视觉、语音转文本和结构化输出的九项基准测试中，表现优于 Gemini-3-Flash、Claude-Sonnet-4.6、GPT-5.4-Mini 和 Grok-4.3 等领先模型。Interfaze 旨在专注于这些特定任务，为高容量应用的通用大型语言模型提供经济高效且高性能的替代方案。

Nexotao 通过单一API统一访问Claude、GPT和DeepSeek模型

测验揭示LLM在价值观、伦理和偏好上的对齐情况 · 跟踪3个来源

AI行业转向整合，推出新的中端模型和多模态产品

音乐视频流水线集成LTX 2.3、ComfyUI和Grok 4.3

百度DuMate上线iOS，智谱AI开源GLM-5.2，xAI Grok 4.3登陆Bedrock

xAI 的 Grok 4.3 模型现已在 Amazon Bedrock 上可用

科创50指数大涨超4%，xAI模型登陆Amazon Bedrock · 2 sources tracked

xAI 的 Grok 4.3 现已在 Amazon Bedrock 上推出

UC Berkeley 基准测试揭示大规模 AI 模型成本和速度差异

新基准测试针对恶意代理的AI紧急停止开关

HalBench 基准测试显示 Qwen-3.6 在抵抗虚假信息方面领先开源 LLM

新基准测试大型语言模型在对抗性对话中的动物福利立场

LLM 接受巴利语到英语翻译准确性审计

AI模型测试：Grok 4.3领先，免费版差异巨大

新基准评估人工智能创意写作能力

LLM基准1rok让GPT-5.5、Gemini 3.1、Grok 4.3展开股票选股竞赛

Anthropic 的 Claude 在人工智能安全基准测试中领先，表现优于竞争对手

xAI 悄然重塑 Grok 模型，增加成本并改变行为

xAI 将 Grok AI 集成到开源 Hermes Agent 中

Interfaze 发布新模型架构，专攻高精度确定性任务