一觉醒来,现实世界和虚拟世界不再像以往一样边界分明。
国内这边春节还没过完,OpenAI 直接掀起了 AI 视频革命。
行业内可能是最好用大语言模型 ChatGPT 的母公司 OpenAI 今天全新发布了 Sora 文本生成视频模型,看官网演示视频很牛逼。
https://openai.com/sora
不仅生成的视频长度支持 60 秒,还能够理解你提供给它的语义,最最强的是支持世界模型。
图灵奖得主 LeCun 在 2022 年指出 GPT 大模型很难破除幻觉问题,无法理解世界,看起来这些模型上知天文下知地理,但是连 3 岁小孩的理解能力都没有。
比如一些基础的物理规律,自然环境变化等等。
而头部 AI 视频产品 Runway 在几个月前提的世界模型还处于研发阶段,距离推出也没影。
Pika 技惊四座,但是还无法产生革命性影响。
直至今天 Sora 横空出世,生成连贯性视频长度直接从业界主流的 10s 内,干到了 60s。
话不多说直接看视频:
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
提示:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。
以后短视频会有更多天马行空的踩奶猫出现,如此可爱的哈基米踩奶视频当然是多多益善了。
更有意思的是中国农历新年。
这个场景仿佛身临其境,短视频刷到肯定第一时间点赞。
除了文字生成视频外,图片生成视频也是支持的。
这波 Sora 发布,媒体信息都没咋出现过,官方更是不预热,上来就王炸。
最后再放一部我喜欢的柯基视频。
ChatGPT 这才发布一年半都不到,我们人类文明就迎来了 AI 流媒体时代。
AGI 世界也许很快就会到来。
AI 时代,运用 ChatGPT、Sora、Midjouney 等工具,解决生活和工作中的问题,能够极大提高效率。
这也是我们这一代人的机遇。
网友评论