Bootstrap

文生视频大模型,短视频的过弯点?

随着今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。

6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的技术路线,能够生成具有合理运动和模拟物理世界特性的视频。

截至目前,已有超百万人排队申请内测资格,其中超30万人已获得试用资格,累计生成超700万条短视频。近日,可灵AI终于宣布全面开放内测,同时上线付费会员体系。

其他厂商也在迅速跟进。7月,智谱AI 推出AI生成视频模型智谱清言,用户可在30秒内免费生成6秒视频。

目前来看,被称为“国产版Sora”的可灵AI不仅热度颇高,用户对其评价也不错,在Sora横空出世却迟迟未有完善产品落地的背景下,可灵AI甚至被视为“业内最佳”。

文生视频大模型目前效果如何?为什么厂商们纷纷开始卷文生视频大模型?对于短视频的竞争格局会有哪些影响?

********剑走偏锋,“可灵”大力出奇迹

可灵AI上线至今还不够两个月,已经经历了三次迭代更新,从最开始的文生视频,到现在已可支持图生视频、视频续写、多尺寸选择,在生成细节、构图、运镜美观性、光影方面都有很大改善。

据快手视觉生成与互动中心负责人万鹏飞表示, 可灵AI生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),单次文生视频时长已增至10秒,这一指标已超越了目前市场上大多数视频生成工具。

当下,布局文生视频赛道的大厂和创业公司并不少,不过大部分都没有公布文生视频模型的参数量级,快手也表示“不便透露”。因此,各企业均主要围绕生成视频的时长、视频的分辨率等指标展开比拼。

目前来看,能实现“分钟级”内容生产能力的,之前仅有Sora一颗独苗,能够生成长达60秒的高清视频,现在可灵AI则刷新了这一指标,将生成视频时长拉长至2分钟。

纵观其它同类竞品,腾讯宣布旗下文生视频模型生成时长达到了16秒,预计在三季度达到20秒;字节旗“即梦”最长支持生成12秒视频;美国创企Runway支持生成10秒左右的视频,最多可延长至18

;