效果炸裂！OpenAI首个AI视频模型重磅发布

chatgpt2024-02-16 13:17:25126

你能想象吗？这个视频全部由AI根据文字描述自动生成——

“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。”

当我们还在惊奇AI绘图的时候，技术发展已经更进一步。

2月16日，OpenAI首个视频生成模型Sora发布。这个文生视频大模型，可以仅凭文字描述创造逼真的场景，生成长达60秒钟的高清流畅视频。根据OpenAI官网介绍，Sora“通过一次性为模型提供多帧的预测，我们解决了一个具有挑战性的问题”。

“60s超长长度”“单视频多角度镜头”“世界模型”，这是不少业内人士给出的三个关键词。

Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容，还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解，能准确解读提示，并生成表达丰富情感的引人入胜的角色。

此外，Sora还能在单个生成的视频中创建多个镜头，使角色和视觉风格保持准确一致。比如一大群纸飞机在树林中飞过，Sora知道碰撞后会发生什么，并表现其中的光影变化。

“镜头跟随一辆带有黑色车顶行李架的白色老式SUV，它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶，轮胎扬起灰尘，阳光照在SUV上飞驰。土路，给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方，看不到其他汽车或车辆。道路两旁都是红杉树，零星散落着一片片绿意。从后面看，这辆车轻松地沿着曲线行驶，看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉，上面是清澈的蓝天和缕缕云彩。”

“一个短毛绒怪物跪在一支红蜡烛旁的动画场景”

AI视频的难度，要比AI绘图的难度大得多。当前很多相关技术还在几秒钟连贯性的边缘挣扎，而且基本都是单镜头生成，在真实物理感觉等方面也与现实相差甚远。Sora模型的发布，无异于一枚重磅炸弹，迅速在科技圈引发热议。

“现实，不存在了”“效果炸裂”“彻底端掉行业饭碗”“AI视频要变天”……网络上的评论不吝溢美之词。

根据媒体报道，得益于DALL·E 3所使用的扩散模型，以及GPT-4的Transformer引擎，Sora不仅能够生成满足特定要求的视频，而且能够展示出对电影拍摄语法的自发理解。

例如，在一个以“色彩缤纷的鱼类和海洋生物充斥的，由纸艺精心构建的珊瑚礁世界”为主题的视频中，Sora通过其摄影角度和拍摄时机，成功地推进了故事的发展。视频中发生了多次镜头转换，由模型一气呵成生成。

可以预料的是，Sora模型以文生成视频的模式，将对很多传统影视公司产生巨大的冲击。以前技术团队需要十几天甚至几个月才能完成的内容，以后可能只需要轻轻敲下两行文字。业内人士预测，Sora模型有可能重塑视频行业。

当然，Sora当前也存在弱点，模型在准确模拟复杂场景的物理特性方面可能会遇到困难，也可能无法理解具体的因果关系实例。此外，模型还可能会混淆提示的空间细节，在处理随时间发生的事件的精确描述方面也可能存在困难等。

但它的出现，无疑让虚拟与现实的界限更加模糊。与2022年11月OpenAI发布ChatGPT一样，Sora具有重要的里程碑意义。

过去我们常说“有图有真相”，P图操作和AI绘图打破了这个认知；Sora模型出现后，有视频也不一定就是真相了。与此同时，在法律与伦理层面，Sora模型也将带来更多新情况，需要谨慎应对。

综合OpenAI官网、每日经济新闻等。

本文链接：https://xhhm.cc/chatgpt_22.html

效果炸裂！OpenAI首个AI视频模型重磅发布

相关文章

如何在2023年轻松注册ChatGPT？

如何搭建一个基于ChatGPT的推荐系统？小白也能轻松上手的教程！

如何在ChatGPT中注册并开始你的AI聊天之旅？

chatgpt商业四维

ChatGPT收费版是包月服务吗？一文搞懂注册与付费细节

如何使用ChatGPT提升谷歌应聘竞争力？

如何在小白也能轻松安装ChatGPT？一步一步教程来了！

ChatGPT 为什么这么厉害？注册指南全解析！

网友评论