一项新的基准测试显示,JSON 和 TOON 等常见数据格式在处理大型语言模型时存在困难,在大规模处理时无法保持准确性和有效性。研究发现,JSON 在仅有 500 条记录时就会崩溃,导致 GPT-5.5 等模型返回空字符串,Opus 则出现严重的计数错误。TOON 也无法生成有效输出,所有测试的尖端模型都出现了持续的编码错误。然而,新的 GCF 格式在所有测试模型中均实现了 100% 的理解和有效生成,在准确性和成本方面均优于 JSON 和 TOON。 AI
影响 新的数据格式 GCF 在 LLM 方面表现优于 JSON 和 TOON,有望提高数据处理的效率和准确性。
排序理由 该集群描述了一个新颖的基准测试和一种旨在提高 LLM 性能的新数据格式,符合研究的定义。[lever_c_demoted from research: ic=1 ai=1.0]
- Claude Opus
- Claude Sonnet
- Gemini 2.5 Pro
- Gemini 3.1 Flash Lite
- Gemini 3.1 Pro
- Gemini 3.5 Flash
- GPT-5.4
- GPT-5.4-mini
- GPT-5.5
- Haiku
- JSON
- Opus
- TOON
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →