

Meta 推出了全球最大的多模态翻译模型 SeamlessM4T,支持 100 种语言,并能够识别地方方言。该模型可以执行语音到文本、语音到语音、文本到语音和文本到文本的多模态翻译任务。SeamlessM4T 集成了 Meta 之前发布的 NLLB、MMS 等翻译模型,并使用大量的语音和文本对齐数据进行训练。该模型在多任务翻译中取得了先进的成果,并在鲁棒性测试中表现出色,尤其是在背景噪声和说话人变化的识别上。同时,该模型显著提高了中低资源语言的性能。
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/4e5f6d49暂无评论...