OpenAI提供有限的访问权限以进行文本转语音生成

快速导读:OpenAI提供了对Voice Engine的受限访问,Voice Engine是一个能够基于短语音片段创建合成音频的文本转语音生成平台。这种AI生成的声音可以用多种语言朗读文本提示。包括Age of Learning和HeyGen在内的多家公司已获得了该技术的访问权限。OpenAI已实施使用政策以防止不道德的使用,并添加了水印以跟踪音频片段的来源。

Voice Engine的开发和开发者访问

OpenAI在2022年末开始开发Voice Engine,并已在文本转语音API和ChatGPT的朗读功能中使用它。该模型是基于许可和公开可用数据的组合进行训练的。只有大约10个开发者将能够访问这项技术。

AI文本转音频生成领域的发展

AI文本转音频生成是生成AI领域内一个不断发展的领域。虽然许多人关注乐器或自然声音,但由于各种担忧,声音生成一直受到较少关注。Podcastle和ElevenLabs等公司已经探索了AI语音克隆技术,但OpenAI的Voice Engine代表了一个重要的进展。

道德考虑和保障措施

为了解决道德问题,使用Voice Engine的OpenAI合作伙伴必须遵守使用政策。这些政策禁止未经同意的冒充,要求从原始发言人获得明确和知情同意,并要求向听众披露这些声音是由AI生成的。OpenAI还实施了水印技术来跟踪音频片段的使用,并积极监控其使用情况。