近期关于大型视觉语言模型(LVLMs)在指称性交流方面的两项研究,在它们协调有效指称表达的能力上得出了相互矛盾的结果。Jones等人的一篇论文表明,当明确提示时,LVLMs可以有效地协调,但无法从隐式提示中推断出这种需求。另一篇由Zeng等人撰写的论文指出,LVLMs在指称表达的交互式生成和解析方面存在困难,这凸显了在构建对人类协作至关重要的共同基础方面存在缺陷。两项研究都利用了指称性交流实验来探讨这些差异。 AI
排序理由 两篇在arXiv上发表的学术论文,详细介绍了对LVLM通信能力的研究。
- arXiv
- Hugging Face
- Jones et al.
- LVLMs
- Zeng et al.
- alphaXiv
- CatalyzeX
- CORE Recommender
- DagsHub
- Gotit.pub
- Influence Flower
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →