Atacama的回答
在WAIC现场。确实现场发现了一个事实,就是大语言模型太多了、同质化比较严重;图片生成大模型也太多了,卷得也不成样子;视频大模型只看到两家,但能打的就只有可灵。而就算放到全球范围内,可灵也是完全的第一梯队。看到前排@德里克文 直接把可灵排到第一了。因为毕竟sora还没放出来嘛,而可灵现场说在内测的用户已经30w+,生成的视频已经700w+了。
一个月迭代3次,说明视频大模型的学习能力还是很强的,涌现的速度似乎已经超过了大语言模型和图片大模型。现场发布的功能除了推出高清版和首尾帧控制,还有镜头控制、单次生成超过10s、上线web端等。现场可灵的负责人还说,已经开发好一些其他的功能了,只是还没放出来。这些功能包括人物ID保持、语音面部匹配、画面结构控制等。
AI生成视频与实拍实拍的效果极进逼近,这一天可能也不会太远了。
移动互联网时代短视频吞噬一切,那么,AI时代,会不会视频生成成为最大的公约数呢?Anyway,个人感觉视频化的应用场景可能要远远超过文字及图片,相信接下来视频大模型在底层和应用,甚至产业化的跃进速度都会超过前两者。
而且我看现场快手商业化负责人分享的,可灵也早已经应用到站内的商业化广告业务上了。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...