一项新发表在arXiv上的研究探讨了用户在与模态多个人机交互系统交互时所经历的感知差异。该研究将使用Whisper、Florence-2和Llama 3.1的基线系统与改进配置进行了比较,改进配置采用了Grounding DINO + SAM和Qwen 3.5 9B。用户反馈表明,用户显著偏爱改进后的系统,认为其速度、可靠性和整体能力评分更高,这凸显了用户为中心的评估与技术指标同等重要。 AI
影响 强调了用户感知在评估AI系统中的重要性,表明技术改进必须转化为用户可感知的实际益处。
排序理由 学术论文,详细介绍了关于模态多个人机交互系统的用户研究。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →