Google Research推出Lumiere:一种基于人工智能的文本到视频生成器

快速导读:Google Research开发了Lumiere,一种先进的文本到视频生成器。这种下一代人工智能技术允许用户输入简单的句子,并根据其输入生成完整的视频。Lumiere利用了一种开创性的时空U-Net架构,在单个模型通道内生成高分辨率的动画视频。该生成器还提供了视频编辑和各种风格化选项等附加功能。虽然Google尚未宣布公开发布的计划,但Lumiere代表了文本到视频生成领域的重大进展。

将人工智能应用从研究转移到用户

多年来,人工智能应用已经从研究实验室转向更广泛的用户群体。值得注意的是,像ChatGPT这样的LLM已经被集成到浏览器中,使用户能够以前所未有的方式生成文本。最近,文本到图像和文本到视频生成器已经出现,使用户能够使用最少的输入创建超现实的图像和短视频片段。Google的Lumiere作为一种尖端的文本到视频生成器脱颖而出,为用户提供基于简单句子输入的令人惊叹的高分辨率视频。

Lumiere背后的技术

Lumiere的基础技术是一种开创性的时空U-Net架构。这种创新设计使生成器能够在单个模型通道内生成动画视频。除了令人印象深刻的视频生成能力外,Lumiere还提供了视频编辑和风格化等高级功能。用户可以通过突出显示特定部分并输入指令(例如更改服装颜色)来编辑现有视频。该生成器还支持不同的风格参考,并且可以将静止图像动画化,创造出电影图形效果。

总结

虽然Google尚未公开披露发布计划,但Lumiere代表了文本到视频生成领域的重大进展。其尖端技术,包括时空U-Net架构,使用户能够根据简单的句子输入生成高分辨率视频。该生成器还提供了视频编辑和各种风格化选项等高级功能。通过Lumiere,Google继续推动基于人工智能的视频生成的边界。