这年头,一提到人工智能(AI),你可能会想到那些巧妙拼接起来的图片,或者是机器人在电影里做出的各种花哨动作。不过,OpenAI这个名字搞得沸沸扬扬的新闻你应该听说过吧?最近,他们又放了个大招:一个叫做Sora的视频生成模型。
先别急着感叹科技的不可思议。让我告诉你,这个Sora有多厉害。要知道,在我们还在为抖音上那些15秒小视频点赞时,Sora已经可以根据用户的一段文字说明轻松制造出长达一分钟的视频了!是不是觉得有点像魔术?但这就是现实。只要你告诉它,“我想看一个穿越古代丝绸之路的商队”,没几下它就能把这群人和骆驼呈现在屏幕上。
OpenAI团队对外表示,Sora模型在创造力和想象力方面远超以往任何AI系统。比如说,在演示视频中,他们就展示了如同穿越时空隧道般回到淘金热时期加州的空中场景;又或者是仿佛真正坐在东京某辆火车里拍摄出来的画面。当然了,虽然称得上逼真,但如果仔细看还是能发现些许瑕疵——譬如某个角落里物体运动得有点违反物理常识。
但别因为这几个小瑕疵就小瞧了Sora。试想一下,曾几何时我们还只能依靠大片制作团队、复杂设备才能拍出一部分故事情节;而今天仅仅通过敲打键盘输入文字说明,AI就可以给我们生动再现一个场景!Sora甚至可以处理具有多重角色、特定运动类型以及复杂主题和背景细节等高难度任务。
除此之外,Sora還具备从静止图像生成视频内容、填充缺失帧数或者延伸现有视频片段等功能。意味着它不光能“编故事”,还能成为后期制作中弥补画面缺陷、增添内容丰富性的好帮手。
说实话,在听到所有这些介绍后, 你可能会觉得自己像是活在科幻小说里。然而, 现实就是如此奇妙, Sora所展示出来的技术仅仅代表了冰山一角。目前市面上类似文本到视频生成器颇为罕见, 其他公司虽然也推出了类似产品—比如Runway和Pika—但他们离真正意义上“懂”用户需求、完美转换文本内容到视频还有距离。
谷歌旗下项目Lumiere也步入了这个领域,并提供相似服务; 但OpenAI显然已经获得先发优势,并通过持续改进其模型来保持领先地位。
此外, OpenAI并没有将其神秘技术锁在金库内部, 而是选择与视觉艺术家、设计师乃至电影制作人合作, 探索更多可能性,并且寻找反馈以促进模型改善和优化。
当然, 随着 AI 技术发展突飞猛进, 模拟现实变得愈发精准与生动后, OpenAI同样需要考量其社会责任问题 —— 尤其是关于虚假内容制造导致误解甚至欺骗事件频发问题。为防止滥用情况产生, OpenAI此前也曾宣布将在 DALL-E 3 这款文本转图像工具中添加水印功能; 不过同时指出水印可以被轻易移除。
总而言之,Sora代表着 AI 领域巨大飞跃. 用户将享受前所未有创意自由度——用简单文字即可创造复杂、生动而富于想象力的视觉体验. 当我们向未来迈进,Sora无疑将开启全新篇章.
网友评论