AI语音、AI翻译?meta公司震撼发布SeamlessM4T:跨越语言壁垒,多模态翻译开创未来

资讯11个月前更新 花花
227 0 0
AI语音、AI翻译?meta公司震撼发布SeamlessM4T:跨越语言壁垒,多模态翻译开创未来

概要: 语言的壁垒即将被打破,meta公司带来了全球首款多模态AI翻译模型SeamlessM4T,实现了跨语言的无缝交流。这一突破性创新集成了语音转文本、语音合成、文本转文本等功能,覆盖近百种语言。

随着全球紧密相连,跨越语言的需求变得越发迫切,而实现不同语言间流畅交流仍然是一大挑战。

今天,我们见证了meta公司发布SeamlessM4T,这是一款引领潮流的多模态多语言AI翻译模型。SeamlessM4T的特点如下:

  • 支持近百种语言的语音识别
  • 跨足近百种输入输出语言的语音转文本翻译
  • 支持近百种输入语言和36种输出语言(包括英语)的语音转语音翻译
  • 完成近百种语言的文本转文本翻译
  • 支持近百种输入语言和35种输出语言(包括英语)的文本转语音翻译

meta公司以开放科学的精神,向全球发布了SeamlessM4T,并授予研究许可,为各界研究者和开发者提供了创新的舞台。同时,我们还公开发布了SeamlessAlign的元数据,这是规模最大的开放多模态翻译数据集,总计包含270,000小时的精心对齐的语音和文本数据。

构建类似于《银河系漫游指南》中虚构的通用翻译器一直以来都是个巨大挑战,因为现有的语音到语音和语音到文本系统只覆盖了全球语言的一小部分。然而,SeamlessM4T的发布是迈向这个目标的坚实一步。与传统的分离模型相比,SeamlessM4T的一体化系统方法减少了错误和延迟,提高了翻译的效率和质量,使得不同语言背景的人们能够更自如地交流。

SeamlessM4T借鉴了多年来在通用翻译领域取得的研究成果,例如去年发布的支持200种语言的文本到文本机器翻译模型No Language Left Behind(NLLB),以及首个为没有广泛书写系统的闽南语实现直接语音到语音翻译的通用语音翻译器。SeamlessM4T以这些项目为基础,实现了多语言和多模态领域的突破。

然而,这只是全球科技前沿的一个起点。未来,meta公司将持续探索基础模型如何为跨语言交流带来新的可能,最终实现一个无障碍交流的世界。

扫描以下二维码加群

告诉管理员您遇到的问题

我们会第一时间为您挑选优质教程和帮您解决问题

AI语音、AI翻译?meta公司震撼发布SeamlessM4T:跨越语言壁垒,多模态翻译开创未来
© 版权声明

相关文章

分享