全国政协委员李景虹建言夯实行业数据底座:用“数据工场”推动“人工智能+”走向专业赋能

新华社北京3月4日电 全国政协十四届四次会议4日在北京开幕。智能技术深度赋能千行百业,已成为本次会议期间代表委员热议的重要议题之一。全国政协委员、九三学社中央常委、中国科学院院士李景虹在会议期间提出,当前智能技术正处于从"通用能力"向"专业赋能"演进的关键节点,亟需从数据基础、基础设施、体制机制等多个层面系统发力,方能真正释放其对实体经济的赋能潜力。 一、通用模型遭遇专业壁垒,行业赋能面临深层制约 近年来,智能技术在语言理解、图像识别、逻辑推理等通用领域取得显著进展,但在化工、材料、生物医药、精密制造等高度依赖专业知识的行业场景中,其实际效能仍与预期存在明显落差。李景虹指出,根本原因在于行业高质量数据的系统性缺失。 具体表现为四个层面:其一,由财政资金支持产生的大量科研数据长期沉淀于机构内部,开放共享机制不健全,获取渠道不畅,公共知识资源的社会价值未能充分释放;其二,在化工、材料、生物医药等关键领域,我国长期依赖购买境外商业数据库,自身缺乏系统性的数据积累与标准化体系,数据孤岛现象普遍;其三,流程工业、生物医药等领域的高质量数据生成高度依赖自动化实验室、数字孪生平台、高通量测试等专业设施,此类基础设施建设成本高、周期长,目前我国整体尚处于起步阶段;其四,场景数据回流机制不清晰,数据在应用端产生后难以有效反哺模型迭代,数据飞轮效应难以形成。 上述问题相互叠加,导致智能技术在专业领域的落地应用缺乏坚实的数据支撑,制约了其对产业升级的实际贡献。 二、四维协同发力,构建行业数据生态 针对上述短板,李景虹提出从规划引领、设施建设、开放共享、规则明晰四个维度共同推进,系统构建支撑智能技术纵深发展的行业数据生态。 在规划引领层面,建议优先选取生物医药、高端材料、精细化工、智能制造等数据价值密度高、智能化需求迫切的行业开展试点,针对每个试点行业研究制定高质量数据发展指南,明确数据定义标准、技术规范及阶段性建设目标,以点带面,逐步形成覆盖重点行业的专业数据资源体系。 在设施建设层面,李景虹提出布局行业级"数据工场"的构想。建议设立专项资金,引导社会资本参与,支持行业龙头企业、国家级科研平台与高等院校联合建设自动化实验室、数字孪生平台、行业知识库等数据生产型基础设施,系统性完成高价值行业数据的生成、标注、清洗与验证工作,为模型训练提供持续稳定的高质量数据来源。 在开放共享层面,建议在试点行业内由行业协会或第三方可信机构牵头,探索建立基于贡献度评价与权益分配的数据共享联盟,鼓励企业运用联邦学习、隐私计算等技术,在保障核心数据安全的前提下贡献脱敏数据用于公共模型训练,并共享模型能力提升带来的增值收益。同时,推动央国企与公共机构有序开放数据资源,激活存量数据的社会价值。 在规则明晰层面,建议加快完善场景数据回流的制度安排,明确数据权属、收益分配与安全边界,为数据要素的市场化流通提供清晰的规则依据。 三、教育科技人才协同推进,打通创新价值链 李景虹同时强调,推动智能技术向专业纵深演进,不能仅依赖单点技术突破,必须将教育、科技、人才置于同一改革框架下兼顾,打通从基础研究到产业应用的完整价值链。 在教育层面,他建议在高校系统布局建设一批智能技术与对应的学科深度融合的交叉学科与交叉学院,打破传统院系壁垒,推动智能技术与基础学科、工程学科、人文社科的有机融合,为行业专业化应用培育复合型人才。 在科技评价层面,建议加快推进科研评价体系改革,减少对论文数量、项目层级等显性指标的过度依赖,强化对研究成果原创性、科学价值及其对产业发展实际贡献的综合考察,引导科研力量向真正具有战略价值的方向集聚。 在产学研协同层面,建议深入破除制约合作的制度藩篱,建立健全风险共担、利益共享的长效合作机制,支持行业龙头企业深度参与科研攻关与人才培养,推动创新链与产业链深度融合。

人工智能的发展不仅关乎技术突破,更需要完善的数据生态和制度创新;李景虹委员的提案既着眼当前问题,又谋划长远发展,提出的"数据工场"等创新机制有望为专业领域赋能提供解决方案。在数字化转型进程中,只有夯实数据基础、激发创新活力,才能让人工智能真正成为推动高质量发展的新引擎。