研究人员推出 ShutterMuse,这是一种新推出的多模态大语言模型(MLLM),旨在为摄影提供实时指导。与专注于事后图像裁剪的现有基准不同,ShutterMuse 解决了拍摄时辅助的需求,为相机构图和主体摆姿提供建议。该模型在一个新创建的包含 130,000 个样本的数据集上进行训练,并在 CaptureGuide-Bench 上进行评估,在摄影师端的构图方面表现出色,并在降低推理成本的同时,在主体端的姿势推荐方面具有竞争力。 AI
影响 通过提供智能、实时的创意辅助,可以增强摄影师的用户体验和效率。
排序理由 介绍新模型和数据集以用于特定 AI 应用的新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CaptureGuide-Bench
- CaptureGuide-Dataset
- CatalyzeX
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Influence Flower
- MLLMs
- ScienceCast
- ShutterMuse
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →