苹果的AI图像编辑器:MGIE

快速导读:苹果已确认进军AI领域,开发了MGIE,一款AI图像编辑程序。MGIE代表“MLLM引导图像编辑”,利用多模态大语言模型同时处理文本和图像。它能理解简短的用户命令,并生成视觉想象来指导像素级调整。虽然竞争对手如DALL-E和Stable Diffusion也具有类似功能,但苹果声称MGIE能够理解简洁的命令,使其与众不同。除了MGIE,苹果还在开发其他AI项目,包括AI聊天机器人和AI驱动的心理健康服务。

苹果的AI是如何工作的?

苹果的MGIE以两种方式利用多模态大语言模型(MLLM)。首先,它使用MLLM从用户输入中提取富有表达力的指令,指导编辑过程。例如,“让天空更蓝”这样的命令将导致MGIE将天空区域的饱和度增加20%。其次,MLLM被用于生成视觉想象,捕捉编辑的本质并指导像素级调整。虽然其他程序(如Stable Diffusion和DALL-E)也有类似功能,但苹果的AI工具通过理解简短的用户命令使自己与众不同。

苹果的其他AI项目

除了MGIE,苹果还参与了各种其他AI项目。其中一个项目是开发一个AI聊天机器人,以与ChatGPT竞争,由Ajax和AppleGPT两个部分组成。Ajax是一个用于创建大型语言模型的平台,使得AI聊天机器人成为可能,类似于OpenAI的GPT-4。AppleGPT作为用户与Ajax互动的界面。苹果在其AI努力中注重隐私,旨在解决与生成式AI技术相关的潜在隐私问题。然而,值得注意的是,苹果的生成式AI工具的输出不能用于开发面向客户的功能。

结论

通过开发MGIE,一款能够理解简短用户命令并生成视觉想象的AI图像编辑程序,苹果明显进军AI市场。虽然竞争对手提供类似功能,但苹果声称MGIE能够理解简洁的命令,使其与众不同。此外,苹果还参与其他AI项目,包括开发AI聊天机器人和AI驱动的心理健康服务。公司在AI努力中注重隐私也是显而易见的。