Audio
OpenAI发布GPT-4o,一种用于ChatGPT的先进AI模型
快速导读:由微软支持的OpenAI发布了GPT-4o,这是一个新的AI模型和ChatGPT的桌面版本。此次更新提升了文本、视频和音频的能力,...
OpenAI的新多模态AI模型:对话和物体识别
快速导读:据报道,OpenAI正在展示一种新的多模态AI模型,可以同时进行对话和识别物体。与OpenAI现有的转录和文本转语音模型相比,该模...
OpenAI的声音引擎:仅凭几秒音频就能克隆声音
声音克隆的突破性成果 OpenAI的声音引擎在声音克隆方面展示了突破性的能力。仅凭15秒的音频样本,该技术可以生成模仿原讲话者声音的语音。该公...
OpenAI提供有限的访问权限以进行文本转语音生成
快速导读:OpenAI提供了对Voice Engine的受限访问,Voice Engine是一个能够基于短语音片段创建合成音频的文本转语音生成平...
Tags