您可以演示 Meta 的 AI 支持的多语言语音和文本翻译器。就是这样
Meta 声称,SeamlessM4T 的单系统方法减少了错误和延迟,提高了翻译的效率和质量。
在录制我的音频后几秒钟内,该模型就生成了文本翻译和音频翻译。
截图由 Sabrina Ortiz/ZDNET 提供
稍后见,谷歌翻译。Bis später。哈斯塔鲁戈。
学习另一种语言是一项艰苦的工作。Meta 的新人工智能翻译模型可以为您完成繁重的工作,您甚至可以自己尝试演示。
周二,Meta 宣布推出 SeamlessM4T,这是第一个一体化多模式和多语言 AI 翻译模型,根据任务支持近 100 种语言。该模型可以执行语音到文本、语音到语音、文本到语音和文本到文本的翻译。
Meta 声称 SeamlessM4T 的单系统方法减少了错误和延迟,提高了翻译的效率和质量。
SeamlessM4T 是公开提供的,并具有研究许可证,允许研究人员和开发人员利用该模型并在此基础上进行构建。然而,即使您不是研究人员或开发人员,也有一种方法可以让您尝试该模型。
您所要做的就是在浏览器中打开此演示链接并记录您想要翻译的完整句子。为了获得最佳效果,Meta 建议在安静的环境中尝试此操作。
然后,您最多可以选择三种要将句子翻译成的语言。输入完句子后,您可以查看转录并收听翻译。
我尝试了该演示,结果的准确性和速度给我留下了深刻的印象。在录制我的音频后几秒钟内,该模型就生成了文本翻译和音频翻译。
由于这是一个实验性研究演示,Meta 警告说,它可能会产生不准确的翻译或改变您输入单词的含义。如果用户遇到这些不准确的情况,Meta 鼓励他们使用反馈功能来报告错误,以便改进模型。