chatgpt注册教程

OpenAI 员工: Sora 在视频生成领域的地位,就像 GPT-2 在 2018 年为文本生成所起的革命性作用一样

chatgpt2024-03-04 15:40:33266
结合最新的 Sora 视频,和一位 OpenAI 员工的观点来分析 Sora 的不足

一、最新 Sora 视频

我们先来看一下最新的 Sora 视频,这是一位参与测试的专家发布的

一共三个视频:

提示 1:一只中等体型、看上去很友善的狗走过工业停车场。环境多雾、多云。采用 35mm 胶片拍摄,色彩鲜艳

提示 2:3D 打印机在光线昏暗的办公室里打印一个红色小立方体的延时拍摄特写。

提示 3:一位年轻的专业产品评论员在光线充足的视频工作室中坐在一台带有两个显示器的计算机前,周围都是各种小玩意和技术。他拿着电影摄影机,思考下一步要制作什么视频。他处于对焦状态,而背景则略微模糊以达到电影效果

细心的你是否看出破绽?

没错!第 3 个视频,打光非常棒!灯光和阴影匹配得非常好。

桌子对面,电脑,键盘,脸等等......

但是,这位老兄有 6 个手指头!六指琴魔?

参与测试的老兄说,Sora 的不足包括:

1、物理模拟

它可能会在物理方面遇到困难,特别是在腿/行走方面。在 Sora 生成的步行视频中,双腿经常交叉并相互融合。

2、真实重现有一定困难

此外,品牌商品与现实生活并不完全相符。汽车、相机等物品永远无法完全识别为特定型号

哈哈,这些是生成式 AI 的通病!

半年前,主流绘图 AI 做的图,六个手指,3 条腿 比比皆是,不过最近都完善了。Sora 不久也会改善!

2、Sora = GPT2?

前几天,有位 OpenAI 员工的工作日志刷屏

这名叫 Jason Wei 记录了他 2 月 21 日这天的工作,如下:

注意看,他每天要测试 sona 1 小时

这位每天陪“空老师”玩的兄弟如此评价 Sora:

“我认为 Sora 在视频生成领域的地位,就像 GPT-2 在 2018 年为文本生成所起的革命性作用一样。

GPT-2 的推出,标志着能够产生流畅且语法正确文段的新时代。虽然它无法完美撰写全篇文章,偶尔会出现逻辑不一致或是编造事实的情况,但它开启了模型迭代的新篇章。

仅仅不到五年,GPT-4 已经具备了进行链式思考或撰写长篇幅文章而不编造内容的能力。

同理,Sora 目前能创作出既有艺术感又逼真的短视频。

尽管它还做不到制作出具有连贯角色设定和引人入胜故事情节的 40 分钟电视剧,

我相信,在未来 Sora 以及其他视频生成技术的迭代中,如何保持长时间的内容一致性、实现近乎完美的现实感和创造有深度的故事线等技能,都将得到显著提升。”

编者:gpt1.0完成开发是2018年,2.0是2019年,3.0是 2022年底,4.0是2023年3月。

老兄还提出了对 Sora 的展望:

1、高质量的视频训练资源

与文本相比,视频的信息密度较低,因此,通过视频进行推理等技能的学习将需要更多的计算资源和数据支持。

因此,将其他类型的信息作为视频的辅助信息,对于加速学习过程将至关重要。高质量视频数据的争夺,将如同高质量文本数据集一样激烈。

2、视频处理经验非常重要

拥有视频处理经验的 AI 研究人员将变得极其宝贵,但他们需要像传统自然语言处理(NLP)研究人员一样,适应新的技术范式。

影视行业的变革,可能会跟 GPT-4 改变写作领域一样,成为超越普通作品质量的工具和助手,但离专业作品的水平还有一段距离。”

结论:

综合上述最新的评测和专家、内部人员评价来看,Sora 的推出标志着 AI 视频生成领域的一个重要里程碑,就像 2019 年的 GPT-2

Sora 及未来的视频生成技术在保持内容一致性、实现近乎完美的现实感以及创造有深度故事线方面将获得显著提升。高质量视频数据的竞争、AI 研究人员对新技术范式的适应,以及视频处理经验将成为未来发展的关键因素!

在这个过程中,传统媒体从业人员,尤其是视频相关岗位的视频处理经验非常有用,但也面临重大转型和挑战!胶片转到电脑剪辑那样!

本文链接:https://xhhm.cc/chatgpt_55.html

相关文章

网友评论