山西征集高质量数据集

3月11日,山西省数据局给各个单位下发通知,要求他们把自己手头的高质量数据集给拿出来。这次征集是想让山西数字经济发展得更快更好,大家可以把那些涉及科学研究、工业制造,或者是农业农村、智慧能源这类领域的数据给交上来。这些数据最好是经过系统化的采集和清洗,能直接拿来训练人工智能模型。不论是结构化的数据,还是视频、音频、图形图像这种多媒体内容都可以报上来,数量上最好能有TB级的规模。申报单位得是在省内注册的法人机构,像政府部门、企事业单位、科研院所都行。单位这几年的经营状况得良好,信用、质量、安全方面也不能有啥污点。这些数据集要是已经建成或者还在建设中,有实际的业务应用场景,技术上又比较先进,就能起到示范作用。山西省经济日报的全媒体记者王蕾也关注了这件事。