Meta推出支持1600种语言的语音识别系统并开源
来源:人工智能产业发展联盟AIIA 发布日期:2025-11-20
11月11日消息,Meta基础人工智能研究团队(FAIR)研制的“全语种自动语音识别系统”(Omnilingual ASR)正式发布。该系统具备识别1600余种语言语音的能力,其中500种语言为首次被人工智能系统覆盖。此外,系统依托上下文学习机制,实现“自带语言”功能,用户通过提供少量语音与文本配对样本即可扩展对新语言的支持,无需重新训练模型。在识别性能方面,该系统对78%的测试语言实现了字符错误率低于10%的标准;在训练音频达10小时以上的语言中,该比例提升至95%。为推动技术应用,Meta以Apache2.0许可开源全部模型,涵盖3亿至70亿参数规模,并同步开放包含350种语言的转录语音语料库,采用知识共享署名协议(CC-BY),以支持开发者和研究人员基于实际需求开展进一步开发与适配。该系统为提升语言资源可及性、促进跨语言信息交流提供了技术基础。
链接:https://www.ithome.com/0/896/642.htm
