如何看待国产sora可灵一月之内连续三次升级,推出高清版和首尾帧等功能?视频大模型会出现跃进式迭代吗?

知乎热榜5个月前发布 NIUC!
856 0 0

Atacama的回答

在WAIC现场。确实现场发现了一个事实,就是大语言模型太多了、同质化比较严重;图片生成大模型也太多了,卷得也不成样子;视频大模型只看到两家,但能打的就只有可灵。而就算放到全球范围内,可灵也是完全的第一梯队。看到前排@德里克文 直接把可灵排到第一了。因为毕竟sora还没放出来嘛,而可灵现场说在内测的用户已经30w+,生成的视频已经700w+了。

一个月迭代3次,说明视频大模型的学习能力还是很强的,涌现的速度似乎已经超过了大语言模型和图片大模型。现场发布的功能除了推出高清版和首尾帧控制,还有镜头控制、单次生成超过10s、上线web端等。现场可灵的负责人还说,已经开发好一些其他的功能了,只是还没放出来。这些功能包括人物ID保持、语音面部匹配、画面结构控制等。

AI生成视频与实拍实拍的效果极进逼近,这一天可能也不会太远了。

移动互联网时代短视频吞噬一切,那么,AI时代,会不会视频生成成为最大的公约数呢?Anyway,个人感觉视频化的应用场景可能要远远超过文字及图片,相信接下来视频大模型在底层和应用,甚至产业化的跃进速度都会超过前两者。

而且我看现场快手商业化负责人分享的,可灵也早已经应用到站内的商业化广告业务上了。

© 版权声明

相关文章

暂无评论

暂无评论...