稳定性AI升级图像到视频模型,提供更好的运动和一致性

概要:稳定性AI宣布升级其图像到视频潜在扩散模型,稳定视频扩散(SVD)。新版本SVD 1.1经过优化,可生成具有改进运动和一致性的短视频。该模型可供公众使用,可通过Hugging Face下载。它还将包含在稳定性的订阅会员中,个人和企业用户有不同的会员级别。虽然该模型可以免费用于研究目的,但商业用户需要会员资格。

使用SVD 1.1进行改进的视频生成

稳定性AI最初推出了两个用于AI视频的模型,SVD和SVD-XT。SVD 1.1是SVD-XT的精调版本,以1024×576的分辨率生成四秒钟、25帧的视频。此次升级旨在提供更一致的视频输出,解决了缺乏照片般逼真、运动以及面部和人物生成等问题。公司指出,SVD 1.1的精调是在固定的条件设置下进行的,但在这些设置之外的性能可能会有所不同。

测试和集成

SVD 1.1在实际应用中的性能尚待观察,因为稳定性AI承认一些原始问题可能仍会出现。该模型可以通过Hugging Face或通过稳定性AI开发者平台上的稳定视频扩散API访问。该API允许开发者将先进的视频生成无缝集成到其产品中。稳定性AI面临来自其他公司(如Runway和Pika)的竞争,这些公司提供面向客户的网络平台进行视频生成,但不提供通过API将模型集成到开发者应用程序中。