OpenAI 推出了语音克隆技术，但不会广泛发布。

OpenAI 忍不住开发出了语音克隆技术，这项技术效果如此之好，既让用户感到惊叹又有些害怕。但目前，OpenAI 只将该系统发布给选定的合作伙伴。

这项名为 Voice Engine 的技术可以通过听你说话的 15 秒钟片段来克隆你的声音。此外，复制的声音可以传达情感和人类语言的自然节奏，使 AI 生成的对话听起来真实可信。

OpenAI 表示，它最初于 2022 年底开发了 Voice Engine，用于为 ChatGPT 提供文本到语音转换功能。但公司基本上决定不将 Voice Engine 公之于众，因为认为社会还没有完全准备好迎接这项技术——至少目前还没有。

“我们正在采取谨慎和明智的方式进行更广泛的发布，因为可能会滥用合成语音，”公司在一篇展示 Voice Engine 实例的博客文章中写道。

正如你所听到的，AI 生成的语音通常与参考音频难以区分。落入错误的手中，这项技术显然可能会被用来制造深度伪造以误导公众。但尽管存在滥用的潜在风险，OpenAI 表示 Voice Engine 对社会可能有用。

博客文章接着说，从去年年底开始，该公司开始“与一小群可信赖的合作伙伴”测试 Voice Engine。结果表明语音克隆可以作为学生的阅读助手。它还可以作为翻译工具，使用该人的声音用多种不同语言进行对话。

另一个用例涉及向失去说话能力的人提供语音克隆技术，类似于苹果正在做的事情。因此，OpenAI 决定以预览模式向合作伙伴发布 Voice Engine，前提是合作伙伴同意绝不将该技术用于未经授权的模仿目的。

“合作伙伴还必须向他们的观众明确披露他们听到的声音是 AI 生成的，”公司表示。OpenAI 还添加了水印系统，以帮助检测 Voice Engine 生成的任何 AI 音频。

尽管如此，OpenAI 并不保证会广泛发布语音克隆技术。公司表示，这在很大程度上将取决于社会如何应对生成式 AI 的崛起，这已经在模糊虚构与现实之间的界限。

“我们希望就合成声音的负责任应用展开对话，以及社会如何适应这些新能力，”公司补充道。“基于这些对话和小规模测试的结果，我们将做出更明智的决定，是否以及如何大规模部署这种技术。”