围绕人工智能数据集标准框架2.0，四项标准征求意见后即将发布-行业数据集

行业数据集

HANGYE SHUJUJI

当前位置:首页 >行业权威 >成果发布 >行业数据集

围绕人工智能数据集标准框架2.0，四项标准征求意见后即将发布

来源：CAICT人工智能发布日期：2024-05-30

当前，人工智能技术和应用高速发展，大模型引来爆发式增长，高质量、大规模、多样化的数据集已经成为大模型时代的关键战略要素。中国信息通信研究院（以下简称“中国信通院”）人工智能研究所高度关注人工智能数据集发展现状，依托中国人工智能产业发展联盟（AIIA）数据委员会，5月17日召开了“人工智能数据集系列标准研讨和宣贯会”。

中国信通院专家在会上介绍了当前人工智能数据集标准框架2.0总体框架和相关标准推进情况，并与来自清华大学、中国科学院、中国移动研究院、北数所、中国联通、中国联通、华为、百度、海天瑞声、蚂蚁集团等40余位专家展开了深入讨论。

《大模型数据集开发管理能力评价方法总体要求》

该标准旨在面向大模型数据集拥有方、大模型数据集工具平台提供方、大模型厂商提供大模型数据集开发管理能力构建与评价的标准规范和依据，具体包括管理体系、关键技术、质量控制、资源运营和风险管理共五大组成部分，目前已完成行标立项。

《面向人工智能的数据生产和标注服务能力通用成熟度模型》

该标准旨在面向人工智能数据供应方提供数据标注服务能力的评价与指导，也可作为人工智能数据需求方衡量供应方数据标注服务能力水平的标准依据，具体包括方案制定、项目管理、标注体系、交付能力、服务能力共五大组成部分，目前标准行标立项并通过标准草案送审稿。

《面向人工智能的数据集质量通用评估方法总体要求》

该标准旨在面向数据服务需求方提供人工智能数据集的质量管理引导与选型支撑，也可作为数据提供方衡量人工智能数据集质量管控能力水平的标准依据，具体围绕完整性、规范性、准确性、及时性、一致性、稠密性、多样性、均衡性、相关性、原创性和可塑性等11个核心维度开展人工智能数据集质量管理和评估，目前标准行标立项和通过标准草案送审稿。

《人工智能合成数据生成和管理可信评估方法》

该标准旨在面向数据服务方提供人工智能合成数据生产和应用能力建设指导，同时也为数据应用方和需求方提供选型规范，具体包括数据生成、生产流程、质量评估以及数据管理等共四大组成部分，目前标准行标立项。

下一步，中国信通院将基于会上各位专家的具体建议，持续完善四项系列标准的核心内容，待完成征求意见修改之后将正式发布。

为更好建设推进人工智能数据集标准体系，现面向社会各界公开征集人工智能数据集标准建设需求，请有意向参与的单位扫描下方二维码填写相关信息，截至时间2024年6月10日，诚邀各位专家扫码参与。

联系人

燕老师 17801035157（微信同号）

yanjiangyi@caict.ac.cn

卢老师 15801188612（微2信同号）

lupeiling@caict.ac.cn

在线留言

在线留言

服务申请

中心动态

一站式服务

标注市场

行业权威

报告及研究

成果发布

标准规范

政策服务

数标前沿

云上中心

关于中心

围绕人工智能数据集标准框架2.0，四项标准征求意见后即将发布