人工智能数据质量评估平台
人工智能数据质量评估申请- 
                         提升数据集质量 提升数据集质量通过评估测试,测试报告对数据集质量提出改进建议,评估数据质量得到显著提升。 
- 
                         提升模型能力 提升模型能力通过评估测试,改进后数据质量显著提升,同时,AI大模型的性能也得到显著提升。 
- 
                         成为数据采购的基线 成为数据采购的基线招商局集团将通过中国信通院数据评估作为数据质量验证的红线,要求数据服务商通过中国信通院数据质量评估体系。 
- 
                         助力企业发展 助力企业发展通过评估测试,形成的高质量行业数据集有利于形成标杆示范效应,得到国家与地方政府的资金和项目支持;通过政府组织供需对接,有利于形成产业合作机会;有利于提升企业在行业内的知名度和公信力,形成商业变现与长期收益。 
质量评估优势
质量评估工具链体系
 
            质量评估流程
- 
                             测试准备 测试准备
- 
                             测试执行 测试执行
- 
                             测试反馈 测试反馈
 测试数据准备
                                测试数据准备
                             业务体系梳理
                                业务体系梳理
                             指标筛选与权重设计
                                指标筛选与权重设计
                             数据集分层随机抽样
                                数据集分层随机抽样
                             测试安全方案对齐
                                测试安全方案对齐
                             测试数据集文件导入
                                测试数据集文件导入
                             评估参数初始化设置
                                评估参数初始化设置
                             单点/分布式任务切分
                                单点/分布式任务切分
                             测试质量实时评估
                                测试质量实时评估
                             测试质量阶段性问题分析
                                测试质量阶段性问题分析
                             测试结果人工校验
                                测试结果人工校验
                             质量问题清单梳理
                                质量问题清单梳理
                             质量问题总结分类
                                质量问题总结分类
                             辅助开展质量优化
                                辅助开展质量优化
                             提出质量优化建议
                                提出质量优化建议
                            质量评估案例
- 
                       呼吸医学数据集围绕发热、肺肿瘤、慢阻肺、哮喘等场景,涵盖文本(病历报告、检测报告)、语音(检测语音对)、图像(呼吸医学影像)、多模态(影像图文对等)等100万条。 呼吸医学数据集围绕发热、肺肿瘤、慢阻肺、哮喘等场景,涵盖文本(病历报告、检测报告)、语音(检测语音对)、图像(呼吸医学影像)、多模态(影像图文对等)等100万条。
- 
                       交通物流数据集包括港口、航运、物流、地产、贸易、公路、制造等7个核心业务板块,涵盖10个集团二级公司,包含预训练文本(json格式,1.7TB)+微调问答对(抽检25万条)。 交通物流数据集包括港口、航运、物流、地产、贸易、公路、制造等7个核心业务板块,涵盖10个集团二级公司,包含预训练文本(json格式,1.7TB)+微调问答对(抽检25万条)。
- 
                       建筑行业供应链数据集包括供应商数据集、商品数据集、工程业绩数据集供应链数据集、建筑施工数据集、绿色建筑数据集、行业发展数据集等共10万条。 建筑行业供应链数据集包括供应商数据集、商品数据集、工程业绩数据集供应链数据集、建筑施工数据集、绿色建筑数据集、行业发展数据集等共10万条。
- 
                       新型物流数据集包括文本、图像、视频等不同模态,具体场景涵盖物流行业货运登记、特种物流、物流监控、货物中转、供应链等多个业务场景,总体数据集规模达到50万条以上。 新型物流数据集包括文本、图像、视频等不同模态,具体场景涵盖物流行业货运登记、特种物流、物流监控、货物中转、供应链等多个业务场景,总体数据集规模达到50万条以上。
- 
                       航空行业、航空票务、运营、飞行数据等。 航空行业、航空票务、运营、飞行数据等。
 
             
	     
         
              	 
             会议活动
会议活动
                                     国家动态
国家动态
                                     区域动态
区域动态
                                     他山之石
他山之石
                                     政策法规
政策法规
                                     科创载体
科创载体
                                     
                         
                         
                         
                         
                        