-
智源多模态大模型登Nature,生成式人工智能路线统一到自回归 2026-02-02
在 AI 开发领域,多模态学习——让模型同时理解图像、视频和文本——已经是当代研究的核心方向之一。长期以来,该领域的主要技术路线还是较为依赖扩散模型或者组合架构。虽然这些方法在特定任务上表现卓越,但它们也带来结构复杂、推理成本高、跨模态统一性...
-
谷歌发布Gemini 3 Flash人工智能模型 2025-12-26
12月17日消息,谷歌公司正式推出新一代人工智能模型Gemini 3 Flash,此为继Gemini 3 Pro发布不足一个月后研发的高效版本,旨在通过优化成本结构并保持专业级推理能力,以适配日常应用场景。根据公开测试数据,该模型在多项行业基...
-
英伟达发布开源AI模型系列Nemotron 3 2025-12-26
12月15日消息,英伟达发布新一代开源AI模型系列Nemotron 3,该系列采用混合专家架构,旨在提升多智能体系统的构建效率与可靠性。系列包含三种规格:Nemotron 3 Nano为高效轻量模型,拥有300亿参数,其吞吐量达上一代4倍,推...
-
谷歌地图全面AI化,Gemini驱动“地图智能体”上线 2025-11-20
11月11日消息,谷歌近日宣布在其地图生态中全面集成Gemini大模型,推出三大核心AI能力:Builder Agent(构建智能体)、MCP服务器(模型上下文协议)与Grounding Lite(轻量级知识锚定),不仅赋能开发者零代码创建交...
-
Meta推出支持1600种语言的语音识别系统并开源 2025-11-20
11月11日消息,Meta基础人工智能研究团队(FAIR)研制的“全语种自动语音识别系统”(Omnilingual ASR)正式发布。该系统具备识别1600余种语言语音的能力,其中500种语言为首次被人工智能系统覆盖。此外,系统依托上下文学习...
