欢迎访问AI客栈(AIKeys.XYZ)- 专注分享AI工具,AI教程,交流微信:860056696!

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

还记得年初火爆全网的AI视频生成模型Sora吗?最近,国产版Sora也来了!快手最近推出了一款名为可灵 的全新国产视频生成大模型,主打一个“发布即上线”,现在已经在快影APP中正式开启邀测了。

同时放出了一系列令人惊艳的视频Demo。这款模型不仅能生成长达2分钟的高清视频,还能模拟物理世界特性,其效果堪比Sora。

不止想象力,更懂物理规律

与其他视频生成模型不同的是,「可灵」不仅能生成天马行空的画面,更重要的是,它生成的视频还能符合真实的物理规律,即使是复杂、大幅度的运动也能准确刻画。

例如,在一段展示老虎奔跑的视频中,老虎的四肢动作协调,奔跑过程中躯干的抖动也清晰可见。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

而在宇航员登月的视频中,宇航员的步态和影子的运动都相当自然,仿佛身临其境。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

除了运动规律,「可灵」还能模拟真实世界的物理特性。例如,在一段倒牛奶的视频中,牛奶的流动、液面的上升,甚至是倒液体时产生的泡沫,都与现实世界别无二致。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

更令人惊叹的是,「可灵」甚至考虑到了光学反射。在一只弹钢琴的猫的视频中,猫爪和琴键在光滑表面上的倒影,都随着本体同步变化,细节处理得非常到位。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

相比之下,即使是Sora也难以完美模拟物理规律。例如,在Sora生成的吃汉堡视频中,人物的手指出现了错误,咬合位置和汉堡上的咬痕也不匹配。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

2分钟高清视频,技术路线有何特别之处?

据了解,「可灵」采用了原生的文生视频技术路线,而非传统的图像生成+时序模块组合。这意味着「可灵」可以直接生成视频内容,而不必先生成图像再合成视频,这也正是它能够生成更长、更流畅视频的关键所在。

为了提升视频生成的效果,「可灵」在模型设计、数据保障、计算效率等方面都进行了技术创新。例如,为了提高运算效率,「可灵」没有采用行业主流的DDPM方案,而是选择了传输路径更短的flow模型作为扩散模型基座。

此外,快手大模型团队还构建了完备的标签体系,用于筛选高质量的训练数据,并研发了视频描述模型,可以生成精确、详尽的视频描述,从而提升模型的文本指令响应能力。

拒绝“画饼”,应用落地才是王道

与许多还处于demo阶段的AI模型不同,「可灵」一经发布就立即在快影APP中开启了邀测,并且快手还计划在近期推出基于「可灵」的图生视频功能。

事实上,快手在大模型领域早有布局,此前已经推出了语言模型和文生图模型,并将其应用于AI文案、AI生图等功能。此次「可灵」的发布,更是完善了快手在AI视频生成领域的布局。

作为短视频行业的领军者,快手拥有海量的用户数据和丰富的应用场景,这为「可灵」的落地应用提供了得天独厚的优势。我们期待「可灵」能够在快手的推动下,为用户带来更多更优质的AI视频创作体验,率先把视频生成能力在短视频场景中落地生花。

如果你对AI视频创作感兴趣,可以到快影APP中一探究竟。

快手版Sora来了?!「可灵」开放测试,120s高清视频颠覆想象

传送门:http://kling.kuaishou.com/

举报

给TA打赏
共{{data.count}}人
人已打赏

本文来源:AI Insights

部分文章来自网络转载及用户投稿,内容仅供参考,不代表本站赞同其观点或对其真实性负责,我们不对因网站内容可能给您带来的损失承担任何法律责任!

其他

不用科学上网!怎么使用ChatGPT等多种AI模型?

2024-5-30 10:18:40

其他

推荐一个好玩的手机端视频创作工具(几乎免费,无限制,质量不错)

2024-6-11 10:37:26

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索