AI代理：虚拟助手的下一代

快速导读：对能够通过语音命令在手机上执行任务的AI代理越来越感兴趣。这个概念让人想起2019年推出的Pixel 4的“新Google助手”。在2019年的Google I/O大会上展示的下一代助手展示了通过语音命令打开和控制应用程序、协调应用程序之间的任务、撰写电子邮件以及通过语音命令操作手机的能力，而且延迟很小。此后，这种AI代理技术已经在后续的Google设备上实现。

AI代理能力的进步

新的助手允许用户使用语音命令在手机上执行各种操作。例如，拍摄和分享自拍照、回复消息、在YouTube上搜索内容、浏览电子邮件以及在网站上搜索特定信息。这些AI代理旨在与不同的应用程序无缝集成，并执行复杂的操作，提供更自然和高效的用户体验。

AI代理的潜力

AI代理有潜力通过使其能够充当真正的代理人来改变虚拟助手，满足用户需求，并超越提供简单答案的功能。据报道，OpenAI正在开发一种名为ChatGPT的代理，可以根据用户的请求执行操作。类似地，Rabbit开发了一个名为大动作模型（LAM）的代理，可以与各种界面进行交互，完成特定任务。这些进展旨在增强虚拟助手的功能，并使其能够更好地理解用户意图和上下文。

AI代理的未来

之前的Google助手版本在理解自然语言命令方面感觉预先编程和能力有限。然而，随着大型语言模型（LLMs）的进展，例如Google Research在实现与移动UI的对话交互方面的工作，AI代理可以快速理解移动界面的目的，并推断出未明确呈现的信息。这为改进用户体验和与虚拟助手更直观的交互打开了可能性。为Android设备开发Gemini AI代理可能是Google努力创建全面和创新的助手、改变我们使用手机方式的下一步。

《堡垒之夜》的浪漫通行证：迷你战斗通行证与TMNT外观

Apple Vision Pro：使用混合现实头盔的骑行未来