AI代理:虚拟助手的下一代

快速导读:对能够通过语音命令在手机上执行任务的AI代理越来越感兴趣。这个概念让人想起2019年推出的Pixel 4的“新Google助手”。在2019年的Google I/O大会上展示的下一代助手展示了通过语音命令打开和控制应用程序、协调应用程序之间的任务、撰写电子邮件以及通过语音命令操作手机的能力,而且延迟很小。此后,这种AI代理技术已经在后续的Google设备上实现。

AI代理能力的进步

新的助手允许用户使用语音命令在手机上执行各种操作。例如,拍摄和分享自拍照、回复消息、在YouTube上搜索内容、浏览电子邮件以及在网站上搜索特定信息。这些AI代理旨在与不同的应用程序无缝集成,并执行复杂的操作,提供更自然和高效的用户体验。

AI代理的潜力

AI代理有潜力通过使其能够充当真正的代理人来改变虚拟助手,满足用户需求,并超越提供简单答案的功能。据报道,OpenAI正在开发一种名为ChatGPT的代理,可以根据用户的请求执行操作。类似地,Rabbit开发了一个名为大动作模型(LAM)的代理,可以与各种界面进行交互,完成特定任务。这些进展旨在增强虚拟助手的功能,并使其能够更好地理解用户意图和上下文。

AI代理的未来

之前的Google助手版本在理解自然语言命令方面感觉预先编程和能力有限。然而,随着大型语言模型(LLMs)的进展,例如Google Research在实现与移动UI的对话交互方面的工作,AI代理可以快速理解移动界面的目的,并推断出未明确呈现的信息。这为改进用户体验和与虚拟助手更直观的交互打开了可能性。为Android设备开发Gemini AI代理可能是Google努力创建全面和创新的助手、改变我们使用手机方式的下一步。