Google Research推出Lumiere：一种基于人工智能的文本到视频生成器

快速导读：Google Research开发了Lumiere，一种先进的文本到视频生成器。这种下一代人工智能技术允许用户输入简单的句子，并根据其输入生成完整的视频。Lumiere利用了一种开创性的时空U-Net架构，在单个模型通道内生成高分辨率的动画视频。该生成器还提供了视频编辑和各种风格化选项等附加功能。虽然Google尚未宣布公开发布的计划，但Lumiere代表了文本到视频生成领域的重大进展。

将人工智能应用从研究转移到用户

多年来，人工智能应用已经从研究实验室转向更广泛的用户群体。值得注意的是，像ChatGPT这样的LLM已经被集成到浏览器中，使用户能够以前所未有的方式生成文本。最近，文本到图像和文本到视频生成器已经出现，使用户能够使用最少的输入创建超现实的图像和短视频片段。Google的Lumiere作为一种尖端的文本到视频生成器脱颖而出，为用户提供基于简单句子输入的令人惊叹的高分辨率视频。

Lumiere背后的技术

Lumiere的基础技术是一种开创性的时空U-Net架构。这种创新设计使生成器能够在单个模型通道内生成动画视频。除了令人印象深刻的视频生成能力外，Lumiere还提供了视频编辑和风格化等高级功能。用户可以通过突出显示特定部分并输入指令（例如更改服装颜色）来编辑现有视频。该生成器还支持不同的风格参考，并且可以将静止图像动画化，创造出电影图形效果。

总结

虽然Google尚未公开披露发布计划，但Lumiere代表了文本到视频生成领域的重大进展。其尖端技术，包括时空U-Net架构，使用户能够根据简单的句子输入生成高分辨率视频。该生成器还提供了视频编辑和各种风格化选项等高级功能。通过Lumiere，Google继续推动基于人工智能的视频生成的边界。

Spotify批评苹果的新计划以符合欧盟法规

Preylock Holdings为Nvidia的圣克拉拉总部获得债务担保