English(EN) VisionAId: An Offline-First Multimodal Android Assistant for People with Visual Impairment, Featuring Personalized Object Retrieval

新的安卓应用 VisionAId 使用设备端 AI 帮助视障人士

作者 PulseAugur 编辑部 · [2 个来源] · 2026-07-02 16:12

研究人员开发了 VisionAId，这是一款安卓应用程序，旨在通过将标准智能手机转变为实时视觉助手来帮助视障人士。该系统利用六个设备端深度学习模型执行深度估计、物体和人脸识别以及定制的纸币检测器等任务，所有这些都通过 ONNX Runtime 离线运行。它还包含一个可选的云端大型语言模型 Google Gemini Flash，用于增强场景描述和物体标记。一个关键功能是其少样本学习能力，用于个性化物体检索，允许用户拍摄特定物品的照片，以便日后通过多模态反馈进行定位指导。 AI

影响该应用程序展示了设备端 AI 为视障人士提供实时援助的潜力，增强了个人自主性。

排序理由该集群描述了一篇研究论文，其中详细介绍了一个新应用程序及其技术规格。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Cristian-Gabriel Florea, Stelian Sp\^inu · 2026-07-03 04:00

VisionAId: An Offline-First Multimodal Android Assistant for People with Visual Impairment, Featuring Personalized Object Retrieval

arXiv:2607.02371v1 Announce Type: cross Abstract: Over 285 million people worldwide live with a visual impairment, for whom everyday tasks such as avoiding obstacles, locating personal belongings, recognizing familiar faces, or handling cash remain persistent obstacles to persona…
arXiv cs.AI TIER_1 English(EN) · Stelian Spînu · 2026-07-02 16:12

VisionAId: An Offline-First Multimodal Android Assistant for People with Visual Impairment, Featuring Personalized Object Retrieval

Over 285 million people worldwide live with a visual impairment, for whom everyday tasks such as avoiding obstacles, locating personal belongings, recognizing familiar faces, or handling cash remain persistent obstacles to personal autonomy. Existing assistive applications are ty…

报道来源 [2]

VisionAId: An Offline-First Multimodal Android Assistant for People with Visual Impairment, Featuring Personalized Object Retrieval

VisionAId: An Offline-First Multimodal Android Assistant for People with Visual Impairment, Featuring Personalized Object Retrieval

相关实体

相关话题