两个AI模型DeepSeek和谷歌的Gemini在上海高中入学考试的一篇作文中获得了66分。题目要求学生思考科技如何重塑世界和人类的想象力。媒体“科创板日报”组织了此次评估。 AI
影响 展示了AI在创意写作和标准化测试方面日益增长的能力。
排序理由 AI模型在学术基准(考试作文)上进行评估。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →