如何看待国产sora可灵一月之内连续三次升级，推出高清版和首尾帧等功能？视频大模型会出现跃进式迭代吗？

Atacama的回答

在WAIC现场。确实现场发现了一个事实，就是大语言模型太多了、同质化比较严重；图片生成大模型也太多了，卷得也不成样子；视频大模型只看到两家，但能打的就只有可灵。而就算放到全球范围内，可灵也是完全的第一梯队。看到前排@德里克文直接把可灵排到第一了。因为毕竟sora还没放出来嘛，而可灵现场说在内测的用户已经30w+，生成的视频已经700w+了。

一个月迭代3次，说明视频大模型的学习能力还是很强的，涌现的速度似乎已经超过了大语言模型和图片大模型。现场发布的功能除了推出高清版和首尾帧控制，还有镜头控制、单次生成超过10s、上线web端等。现场可灵的负责人还说，已经开发好一些其他的功能了，只是还没放出来。这些功能包括人物ID保持、语音面部匹配、画面结构控制等。

AI生成视频与实拍实拍的效果极进逼近，这一天可能也不会太远了。

移动互联网时代短视频吞噬一切，那么，AI时代，会不会视频生成成为最大的公约数呢？Anyway，个人感觉视频化的应用场景可能要远远超过文字及图片，相信接下来视频大模型在底层和应用，甚至产业化的跃进速度都会超过前两者。

而且我看现场快手商业化负责人分享的，可灵也早已经应用到站内的商业化广告业务上了。

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

如何看待国产sora可灵一月之内连续三次升级，推出高清版和首尾帧等功能？视频大模型会出现跃进式迭代吗？

2024 美洲杯 1/4 决赛点球大战乌拉圭 4：3 巴西晋级四强，南德斯领红下场，如何评价本场比赛？

如果祖国人在dc宇宙被两个类似于肯特夫妇的人在婴儿时期收养会怎么样？

相关文章

暂无评论

热门网址

随机文章