下一代语音助手BUD-E:更自然、更响应的人工智能伴侣

快速导读:德国非营利研究实验室LAION开发了下一代语音助手BUD-E,旨在提供沉浸式的对话体验。与当前的AI语音助手不同,BUD-E以更自然、更贴近人类的方式回应,减少延迟,改善对话流程。该系统在消费设备上运行,响应时间快,为300至500毫秒。LAION计划进一步增强BUD-E的功能,包括管理多说话人对话,并邀请开源开发人员和研究人员为其发展做出贡献。

以BUD-E推进对话型人工智能

LAION与图宾根ELLIS研究所、Collabora和图宾根人工智能中心合作,推出了BUD-E,一款旨在彻底改变我们与人工智能系统互动方式的创新语音助手。与当前常见的语音助手相比,BUD-E旨在提供更自然、更沉浸式的对话体验。LAION承认现有的语音助手在理解和适应人类对话的微妙和情感方面存在困难,导致交流不尽人意。BUD-E旨在弥合这一差距,提供更响应、更丰富上下文的对话。

自然且快速:BUD-E的特点

BUD-E不仅提供更自然的对话体验,还具有令人印象深刻的响应时间。BUD-E的延迟时间在300至500毫秒之间,能够快速而无缝地与用户进行互动。该系统在消费设备上运行,使广大用户能够轻松使用。LAION作为BUD-E开发背后的组织,设想未来语音助手可以处理多说话人的对话,包括中断、确认和思考停顿,进一步增强其功能。

开源和社区合作

LAION将BUD-E打造成一个开源项目,允许开发人员和研究人员为其发展做出贡献。目前使用的BUD-E背后的模型包括Nvidia的FastConformer Streaming STT语音转文本模型、Microsoft的Phi-2语言模型以及StyleTTS2文本转语音模型。然而,LAION计划扩展这些模型,并利用像Meta的Llama 2这样拥有300亿参数的更大模型,以实现更低的延迟。有兴趣参与BUD-E开发的人可以加入LAION的Discord社区或通过电子邮件联系。