chatgpt注册教程

OpenAI o1 是什么?o1模型与 CHATGPT-4o 有何不同?

chatgpt2024-09-19 13:06:11266

大型语言模型(LLM)有一个常见的问题,它们经常非常自信地给出答案,哪怕有时答案并不完全正确。

为了解决这个问题,OpenAI 推出了全新的 OpenAI o1 系列模型,目的是让人工智能在处理复杂问题时更谨慎、更细致,而不是一接收到问题就立刻给出答案。

OpenAI o1 的推出是一次创新的尝试。如果它能达到 OpenAI 预期效果,可能会大大提升人工智能的实用性。

什么是OpenAI o1?

OpenAI o1 是 OpenAI 最新推出的系列模型。虽然它们在很多方面都与 GPT-4o 等其他 OpenAI 模型相似,而且仍然使用了Transformer和神经网络等主要底层技术,但 o1 模型在处理复杂任务和需要逻辑推理的更难问题方面要强得多。

这也是 OpenAI 选择将其命名为 o1,而不是 GPT-5 的原因。

目前,o1 有三种模型:

OpenAI o1:最强版本,但目前尚未开放使用。不过 OpenAI 已经公布了有关其性能的信息。   

OpenAI o1-preview:这是完整 o1 模型的预览版,功能不如完整版强大。

OpenAI o1-mini:这是为了速度优化的版本,适合需要快速响应的场景。

o1 系列并不是 GPT-4o 和 GPT-4o mini 的替代品,而是针对不同的需求提供了更高的性价比,特别是在处理复杂任务时,它的表现更加强大。接下来我们来详细了解一下。

OpenAI o1 是如何工作的?

OpenAI 表示,o1 模型经过训练,能够在回答问题之前进行 “思考”。实际上,这意味着它内置了一种名为“思维链推理”(CoT)的提示工程技术。

当你给 o1 模型一个复杂的提示时,它不会立即做出响应,而是将你要求它执行的操作分解为多个更简单的步骤。然后,它会逐步完成这个思维链,最后再给出完整的答案。

OpenAI 介绍了一些使用 o1-preview 模型来解决复杂问题的例子,比如解码加密文本、解填字游戏,以及正确回答数学、化学和英语问题。这些例子可以让你更好地理解 o1 模型是如何工作的。详细示例请看:重磅!OpenAI o1模型问世,首个会“思考”的AI来啦!

不过,OpenAI 并没有把 o1 模型的完整思维过程展示出来,而是生成了一个简化后的总结。虽然这个总结可以让你大致了解模型是如何解决问题的,但并不能让你看到它如何一步步推导出答案的细节。

虽然用“思考”来形容人工智能有点夸张,但确实反映了 o1 模型在给出答案前需要时间去分析和推理。研究表明,思维链推理(CoT)能够显著提高 AI 模型的准确性,所以 o1 在解决复杂问题时表现比 GPT-4o 更好也就不足为奇了。

通过强化学习(即模型在得到正确答案时会获得奖励)来训练 o1 模型,让它尝试不同的方法,识别并纠正错误,并花时间去找到解决复杂问题的最佳答案。

OpenAI 发现,随着训练时间的延长,以及模型在给出答案前思考时间的增加,o1 的性能会不断提升。这意味着 o1 模型所使用的计算资源越多,它的表现就越好,这也是它价格较高的原因。

除此之外,OpenAI o1 的功能似乎与市面上其他 LLM 大同小异。

GPT-4o 与 OpenAI o1 的对比

在需要逻辑推理的任务方面,OpenAI o1 和 OpenAI o1-mini 明显比 GPT-4o 表现得更好。在一些需要逻辑推理的典型 AI 基准测试中,GPT-4o 的表现非常出色,例如 MMLU,虽然 GPT-4o 的表现已经很出色,但 OpenAI o1 的得分依然更高。

当任务需要非常强的逻辑推理时,GPT-4o 的表现往往不尽如人意。

OpenAI 给出的一个例子是 2024 年美国数学奥林匹克(AIME)试卷。在这份包含 15 道高难度数学题的试卷中,GPT-4o 只答对了两道题,而 o1 模型却答对了 13 道题,成绩排名可以进入美国前 500 名学生之列。

在 Codeforces 等编码竞赛中情况也类似,GPT-4o 的得分仅在第 11 个百分位,而完整的 o1 模型的得分在第 89 个百分位,表现明显更好。

不过,在人工评测中,o1-preview 模型在个人写作方面表现略显逊色,而在文字编辑方面,它与 GPT-4o 不相上下。虽然这看起来不是什么大问题,但如果你对比这些模型的使用成本,就会发现其中的差距。

OpenAI o1-mini 更专业一些,根据 OpenAI 公布的信息,它擅长需要逻辑推理和生成代码的 STEM(科学、技术、工程、数学) 问题,但在广泛的常识问题上稍显不足。   

在某些特定任务上,它几乎能和完整的 o1 模型媲美,也比 GPT-4o 强,但在处理一般问题时,它却不如 GPT-4o。o1 和 o1-mini 的主要区别可能在于生成响应时允许的思维链推理时间长短。

例如,当 GPT-4o mini 被问到如何前往上海时,它完全没有提到“游泳”作为一种交通方式有多不现实。

而当你给同样的问题给 o1-preview 时,结果就会准确得多。它会逐步思考,在输出答案前一步步推理。它知道游泳去上海是不现实且不安全的。

OpenAI o1 的价格

通过 OpenAI API,GPT-4o 的价格为每百万个输入token 5 美元,输出token 15 美元。GPT-4o mini 则便宜很多,每百万个输入token 0.15 美元,输出token 0.60 美元。

而 o1-preview 的成本则高得多,输入token每百万个 15 美元,输出token 60 美元。即便是 o1-mini,每百万个输入token也需要 3 美元,输出token 12 美元。

由此可见,虽然 o1 模型在逻辑推理方面表现出色,但这种提升是有代价的。如果你不需要 AI 来处理特别复杂的问题,那么使用 o1 模型的成本会非常高,但性能提升可能并不明显。

如何访问 OpenAI o1

现在,你可以通过 ChatGPT 和 API 使用 OpenAI o1-preview 和 OpenAI o1-mini 模型。如果你订阅了 ChatGPT Plus 或 Teams,每周分别可以发送 30 条和 50 条消息。免费用户暂时还不能使用这些模型,但o1-mini 模型估计很快就会开放。

本文链接:https://xhhm.cc/chatgpt_76.html

gpt4帐号gpt4帐号申请gpt4帐号升级倒卖gpt帐号多少违法GPT4.0帐号停用gpt怎么购买帐号gpt4帐号购买

相关文章

网友评论