【jkfun 029】超级同传!AI完成101种言语即时翻译
。超级我国科学报讯。同传 科幻小说《银河系周游攻略》中的完成jkfun 029翻译动物“巴别鱼”,或许离实际更近了。语即译美国互联网科技公司Meta的时翻研究人员开发了一种机器学习体系,简直能够立行将101种言语的超级语音翻译成36种目标言语中的恣意一种。
这种大规模多言语和多模态机器翻译(SEAMLESSM4T)体系还能够将语音转换成文本、同传文本转换成语音、完成文本转换成文本。语即译jkfun 029相关研究成果1月15日发表于《天然》。时翻
Meta运营着脸书、超级WhatsApp和Instagram等交际媒体网站。同传该公司表明,完成在向全球学术研究人员成功发布LLaMA大言语模型后,语即译将把SEAMLESSM4T开源用于非商业用途。时翻
曩昔几十年里,机器翻译取得了巨大进步,这在很大程度上归功于在大数据集上练习的神经网络。英语等首要言语的练习数据举目皆是,但其他言语的练习数据却少得不幸。这种不平等约束了机器能够翻译的言语规模。美国康奈尔大学的计算机科学家Allison Koenecke表明:“这影响了不经常呈现在互联网上的那些言语。”。
Meta团队在之前语音对语音翻译作业的基础上,敞开了一个名为“不让任何言语掉队”的项目,旨在为大约200种言语供给文本到文本的翻译。依据经历,Meta和其他组织的研究人员发现,即便在翻译那些练习数据有限的言语时,使翻译体系多言语化也能进步其功能,但原因尚不清楚。
该团队从互联网和联合国档案等来历收集了数百万小时的音频文件,以及这些语音的人工翻译。他们还收集了其间一些讲演的文字记载。
研究人员运用牢靠的数据练习模型辨认两份匹配的内容。这使研究人员能够将大约50万小时的语音与文本配对,并主动将一种言语的每个片段与其他言语的对应片段匹配。
SEAMLESSM4T能够将语音转换成语音,而无须先将其转换为文本。语音合成器用于产生音频,它能够翻译101种言语中的任何一种语音,不过到目前为止,只要36种言语可输出。该体系还能够履行其他翻译使命,比方完结不同言语的文本到语音的翻译。
论文作者之一、Meta的计算机科学家Marta Costa-juss表明,除了添加言语数量外,他们还经过整合文本和语音的不同组合进步体系功能。“这些是改进的要害。”她弥补说,该体系的时间延迟一般为几秒钟,与专业人工翻译的体现适当。
作者表明,他们对SEAMLESSM4T进行了微调,例如当翻译中呈现与原文不符的攻击性言语时,能够约束这种状况产生。他们还对体系进行了操控,以避免它将一种言语中无性其他专有词汇(如英语中的“护理”)翻译成其他言语中有性其他对应词。
Koenecke在谈论中写道,为进一步约束主动翻译的潜在危险,“开发人员应该考虑如安在清晰模型局限性的前提下输出翻译”,并考虑“在准确性有争议时彻底抛弃输出”。
英国吉尔福德萨里大学的翻译研究员Sabine Braun说,在机器翻译被广泛选用前,应该进行更多检查,并就怎么运用机器翻译进行教育训练,尤其是身处医疗或法令等要害作业岗位的人。(李木子)。
相关论文信息:
http://doi.org/10.1038/s41586-024-08359-z。
《我国科学报》 (2025-01-20 第2版 世界)。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.3g-sim.com/html/98b099901.html