PulseAugur
实时 10:09:07
English(EN) X+Slides: Benchmarking Audience-Conditioned Slide Generation

新的 X+Slides 基准测试评估 LLM 的面向受众的幻灯片生成能力

研究人员推出了 X+Slides,这是一个新的基准测试,旨在评估大型语言模型在生成幻灯片时面向受众的能力。与以往侧重于完整性和技术深度的基准测试不同,X+Slides 考虑了受众的具体需求,例如需要证明的专家和寻求结论的决策者。该基准测试采用动态评估框架,涵盖 113 个主题和七个演示场景中的 8,133 个探针,报告了受众覆盖率、领域覆盖率、效率和正确性等指标。对 DeepPresenterNotebookLM 等模型的初步实验表明,现有系统可以传达大部分受众必需的信息,但仍有改进空间。 AI

影响 该基准测试可以通过关注受众适应性来推动 LLM 生成内容的改进,从而带来更有效的沟通工具。

排序理由 该集群包含一篇详细介绍用于评估 LLM 功能的新基准测试的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Haodong Chen, Xuanhe Zhou, Wei Zhou, Xinyue Shao, Yanbing Zhu, Bo Wang, Jiawei Hong, Anya Jia, Fan Wu ·

    X+Slides: Benchmarking Audience-Conditioned Slide Generation

    arXiv:2606.19256v1 Announce Type: new Abstract: Automatically generating slide decks from source documents is an important application of large language models (LLMs). Existing benchmarks primarily assess slide completeness and technical depth, while overlooking the target audien…

  2. arXiv cs.AI TIER_1 English(EN) · Fan Wu ·

    X+Slides:面向受众条件的幻灯片生成基准测试

    Automatically generating slide decks from source documents is an important application of large language models (LLMs). Existing benchmarks primarily assess slide completeness and technical depth, while overlooking the target audience as a critical real-world factor. For instance…