OpenAI 忍不住开发出了语音克隆技术,这项技术效果如此之好,既让用户感到惊叹又有些害怕。但目前,OpenAI 只将该系统发布给选定的合作伙伴。
这项名为 Voice Engine 的技术可以通过听你说话的 15 秒钟片段来克隆你的声音。此外,复制的声音可以传达情感和人类语言的自然节奏,使 AI 生成的对话听起来真实可信。
OpenAI 表示,它最初于 2022 年底开发了 Voice Engine,用于为 ChatGPT 提供文本到语音转换功能。但公司基本上决定不将 Voice Engine 公之于众,因为认为社会还没有完全准备好迎接这项技术——至少目前还没有。
“我们正在采取谨慎和明智的方式进行更广泛的发布,因为可能会滥用合成语音,”公司在一篇展示 Voice Engine 实例的博客文章中写道。
正如你所听到的,AI 生成的语音通常与参考音频难以区分。落入错误的手中,这项技术显然可能会被用来制造深度伪造以误导公众。但尽管存在滥用的潜在风险,OpenAI 表示 Voice Engine 对社会可能有用。
博客文章接着说,从去年年底开始,该公司开始“与一小群可信赖的合作伙伴”测试 Voice Engine。结果表明语音克隆可以作为学生的阅读助手。它还可以作为翻译工具,使用该人的声音用多种不同语言进行对话。
另一个用例涉及向失去说话能力的人提供语音克隆技术,类似于苹果正在做的事情。 因此,OpenAI 决定以预览模式向合作伙伴发布 Voice Engine,前提是合作伙伴同意绝不将该技术用于未经授权的模仿目的。
“合作伙伴还必须向他们的观众明确披露他们听到的声音是 AI 生成的,”公司表示。OpenAI 还添加了水印系统,以帮助检测 Voice Engine 生成的任何 AI 音频。
尽管如此,OpenAI 并不保证会广泛发布语音克隆技术。公司表示,这在很大程度上将取决于社会如何应对生成式 AI 的崛起,这已经在模糊虚构与现实之间的界限。
“我们希望就合成声音的负责任应用展开对话,以及社会如何适应这些新能力,”公司补充道。“基于这些对话和小规模测试的结果,我们将做出更明智的决定,是否以及如何大规模部署这种技术。”