OpenAI的声音引擎:仅凭几秒音频就能克隆声音
声音克隆的突破性成果
OpenAI的声音引擎在声音克隆方面展示了突破性的能力。仅凭15秒的音频样本,该技术可以生成模仿原讲话者声音的语音。该公司分享了一个感人的例子,使用这项技术恢复了一个小女孩的声音。虽然该模型显示了令人印象深刻的潜力,但OpenAI正因对合成声音滥用的担忧而谨慎前进。
实际应用和合作伙伴关系
声音引擎在各个领域都有实际应用。OpenAI与Age of Learning合作,利用该技术为非读者和儿童提供阅读帮助。此外,AI可视化故事平台HeyGen使用声音引擎为产品营销和销售演示创建了类似人类的虚拟形象。在翻译目的时,该模型保留了原讲话者的本地口音。
负责任的部署和未来计划
OpenAI致力于负责任地部署声音引擎,并正在进行关于如何扩展和部署该技术的对话。该公司尚未将该模型作为独立产品发布,而是与信任的合作伙伴进行了私下测试。目标是开启关于合成声音的负责任使用以及社会如何适应这些新能力的对话。OpenAI还旨在为巴西公司Livox提供非语言个体支持的独特声音,这些声音不是机器人的声音,并可用于多种语言。
Tags