2月20日,记者从成都市发展改革委获悉,为充分发挥数据要素乘数效应,进一步强化数据供给,更好支撑数据流通和开发利用,现面向社会各界公开征集2025年成都市高质量数据集。
高质量数据集是人工智能赋能新质生产力不可或缺的资源,其类型包括文本、视频、音频、图形图像、结构化数据等。高质量数据集是指经过清洗、标注等数据处理,在格式、质量等方面符合相关要求的数据集,主要包括服务大模型开发和训练的预训练集、指令微调数据集和测试集等。
本次征集围绕工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳和其他重点行业领域,开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集。已建成或在建高质量数据集项目均可申报。
市发展改革委表示,对于征集的高质量数据集,将按照“成熟一个、支持一个”的原则,在产业合作对接、数据资源协调、场景应用宣传等方面给予大力支持,并择优推荐至国家数据局及省发展改革委(省数据局),争取国家及省级层面政策支持,发挥典型示范引领作用。