“方升”多模态大模型及智能体测试技术沙龙第二期即将召开-行业产品及模型

行业产品及模型

HANGYE CHANPIN JI MOXING

当前位置:首页 >行业权威 >成果发布 >行业产品及模型

“方升”多模态大模型及智能体测试技术沙龙第二期即将召开

来源：CAICT人工智能发布日期：2025-04-02

近年来，人工智能技术突飞猛进，多模态大模型与智能体技术协同突破，加速AI原生应用爆发式增长。近期，多模态大模型引入慢思考机制与混合推理架构，显著提升了复杂任务的处理能力，使其为医疗诊断、法律分析、科学研究等领域提供更加精准和可靠的结果。同时，智能体技术取得重要突破，多模态融合拓展了复杂场景应用边界，MCP协议更标准化了记忆管理、多体协作等能力，推动技术进入新阶段。

当前，多模态与智能体的评测仍面临诸多挑战。一方面，多模态大模型复杂度激增，传统测试方法难以评估其分层推理和迭代能力；另一方面，智能体技术发展要求评测体系能支持动态环境中的自主感知、规划与协作，对测试环境的真实性提出了更高要求。

中国信息通信研究院（以下简称“中国信通院”）人工智能研究所紧密跟踪大模型和智能体的技术发展与行业应用动态，构建并发布了“方升”（FactTesting）大模型基准测试体系，自2024年以来已对国内外开源与闭源大模型开展了6轮能力监测，累计测试了200余个大模型，持续跟踪其技术演进与表现，为行业技术选型与能力评估提供了重要依据。2025年，评测范围进一步扩展至多模态理解、文生图、文生视频等领域，并率先开展智能体测试的研究与实践，初步构建了智能体测试验证平台，为产业界提供全面的技术评估参考。

由中国信通院人工智能研究所和人工智能关键技术与应用评测工信部重点实验室主办的“方升”多模态与智能体测试技术沙龙将于4月3日（星期四）举办，本次沙龙旨在推动评测技术创新与基准测试体系升级，促进技术研发与产业应用深度融合。本次沙龙汇聚了来自中国信通院、阿里巴巴、字节跳动、香港大学、上海交通大学等机构的技术专家和研究学者，聚焦评测技术瓶颈突破与产业落地衔接，欢迎有兴趣的单位和专家扫描二维码填写信息报名参会，共同探讨测试技术的发展方向和实践经验。

在线留言

在线留言

服务申请

中心动态

一站式服务

标注市场

行业权威

报告及研究

成果发布

标准规范

政策服务

数标前沿

云上中心

关于中心

“方升”多模态大模型及智能体测试技术沙龙第二期即将召开