未来已来，OpenAI发布文字生成视频模型Sora看完演示视频我已经分不清虚拟和现实了

chatgpt2024-02-16 23:37:59132

一觉醒来，现实世界和虚拟世界不再像以往一样边界分明。

国内这边春节还没过完，OpenAI 直接掀起了 AI 视频革命。

行业内可能是最好用大语言模型 ChatGPT 的母公司 OpenAI 今天全新发布了 Sora 文本生成视频模型，看官网演示视频很牛逼。

https://openai.com/sora

不仅生成的视频长度支持 60 秒，还能够理解你提供给它的语义，最最强的是支持世界模型。‍‍

图灵奖得主 LeCun 在 2022 年指出 GPT 大模型很难破除幻觉问题，无法理解世界，看起来这些模型上知天文下知地理，但是连 3 岁小孩的理解能力都没有。‍‍

比如一些基础的物理规律，自然环境变化等等。

而头部 AI 视频产品 Runway 在几个月前提的世界模型还处于研发阶段，距离推出也没影。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Pika 技惊四座，但是还无法产生革命性影响。‍‍‍‍‍‍‍

直至今天 Sora 横空出世，生成连贯性视频长度直接从业界主流的 10s 内，干到了 60s。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

话不多说直接看视频：

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

提示：一位时尚的女人走在东京的街道上，街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克，红色长裙，黑色靴子，背着一个黑色钱包。她戴着墨镜，涂着红色口红。她自信而随意地走路。街道潮湿而反光，营造出五颜六色的灯光的镜面效果。许多行人四处走动。

官方 Tokyo-walk 演示视频时长 1 分钟

一镜到底，脸部特写、画面流畅，人物主体、动作稳定，要是不告诉你这是 AI 视频，可能还会认为是某部影片的预告片呢。

因为原视频没有声音，我用剪映加工了一下这部长达 1 分钟的预告片～‍‍‍‍‍‍‍‍‍‍

Toyko-walk剪映重制版

是不是加了 BGM 后很有氛围感。

以后短视频创作，可以用 Sora 来生成剧情段落，再导入剪映用模板加工一遍，就是不错的作品了。

因为 Sora 是能够生成多个角色、特定类型运动、主体和背景以及准确细节的复杂场景内容。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

带有世界模型，它能理解真实世界规律。‍‍‍‍

对于普通人来说，AI 时代创作成本无限趋近于零，就像互联网时代，普通人用搜索引擎获取信息变得更容易了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这仅仅是个开始……‍‍‍‍‍‍‍

OpenAI 官方释出的信息只是冰山一角，晚些时候技术文档放出来，才能一探究竟。

还有看到这个演示，我的天！猫可以踩奶了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Prompt: A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the cat tries new tactics and finally the owner pulls out a secret stash of treats from under the pillow to hold the cat off a little longer.

提示：一只猫叫醒熟睡的主人要求吃早餐。主人试图无视猫，但猫尝试了新的策略，最后主人从枕头下掏出一个秘密的零食藏匿处，让猫多呆一会儿。

以后短视频会有更多天马行空的踩奶猫出现，如此可爱的哈基米踩奶视频当然是多多益善了。‍‍‍‍

更有意思的是中国农历新年。‍‍

Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.

提示：中国龙的中国农历新年庆祝视频。

这个场景仿佛身临其境，短视频刷到肯定第一时间点赞。‍‍

除了文字生成视频外，图片生成视频也是支持的。‍‍‍

这波 Sora 发布，媒体信息都没咋出现过，官方更是不预热，上来就王炸。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

最后再放一部我喜欢的柯基视频。

Prompt: A corgi vlogging itself in tropical Maui.

提示：一只柯基犬在热带毛伊岛拍摄视频。

ChatGPT 这才发布一年半都不到，我们人类文明就迎来了 AI 流媒体时代。

AGI 世界也许很快就会到来。

AI 时代，运用 ChatGPT、Sora、Midjouney 等工具，解决生活和工作中的问题，能够极大提高效率。

这也是我们这一代人的机遇。‍‍‍‍‍‍

本文链接：https://xhhm.cc/chatgpt_12.html

未来已来，OpenAI发布文字生成视频模型Sora看完演示视频我已经分不清虚拟和现实了

相关文章

如何在2023年轻松注册ChatGPT？

如何搭建一个基于ChatGPT的推荐系统？小白也能轻松上手的教程！

如何在ChatGPT中注册并开始你的AI聊天之旅？

chatgpt商业四维

ChatGPT收费版是包月服务吗？一文搞懂注册与付费细节

如何使用ChatGPT提升谷歌应聘竞争力？

如何在小白也能轻松安装ChatGPT？一步一步教程来了！

ChatGPT 为什么这么厉害？注册指南全解析！

网友评论