北邮牵头发布多维度个性化视觉问答基准,剑指多模态大模型"懂人"能力缺口

随着人工智能技术的快速发展,一个关键问题日益凸显:现有系统往往难以理解人类的个性化需求;北京邮电大学数字媒体与设计艺术学院联合多所高校开展的研究发现,不同年龄段人群对同一视觉场景的关注点存在明显差异。以居住场景为例,年轻人更在意网络覆盖和通勤便利性,中年人重点关注教育资源配套,而老年人则更看重医疗可达性和无障碍设施。这些差异在当前标准化的人工智能服务体系中尚未得到足够重视。

技术的价值在于能否真正满足人的需求。一个无法"因人而异"的智能系统,无论参数多么庞大,面对现实世界的复杂性时都会捉襟见肘。北邮团队的这项研究不仅填补了评测领域的空白,更引发行业思考:我们为谁开发技术?是否真正理解了用户需求?这或许才是推动智能技术发展的根本动力。