OpenAI o1 是什么？o1模型与 CHATGPT-4o 有何不同？

chatgpt2024-09-19 13:06:11266

大型语言模型（LLM）有一个常见的问题，它们经常非常自信地给出答案，哪怕有时答案并不完全正确。

为了解决这个问题，OpenAI 推出了全新的 OpenAI o1 系列模型，目的是让人工智能在处理复杂问题时更谨慎、更细致，而不是一接收到问题就立刻给出答案。

OpenAI o1 的推出是一次创新的尝试。如果它能达到 OpenAI 预期效果，可能会大大提升人工智能的实用性。

什么是OpenAI o1？

OpenAI o1 是 OpenAI 最新推出的系列模型。虽然它们在很多方面都与 GPT-4o 等其他 OpenAI 模型相似，而且仍然使用了Transformer和神经网络等主要底层技术，但 o1 模型在处理复杂任务和需要逻辑推理的更难问题方面要强得多。

这也是 OpenAI 选择将其命名为 o1，而不是 GPT-5 的原因。

目前，o1 有三种模型：

OpenAI o1：最强版本，但目前尚未开放使用。不过 OpenAI 已经公布了有关其性能的信息。

OpenAI o1-preview：这是完整 o1 模型的预览版，功能不如完整版强大。

OpenAI o1-mini：这是为了速度优化的版本，适合需要快速响应的场景。

o1 系列并不是 GPT-4o 和 GPT-4o mini 的替代品，而是针对不同的需求提供了更高的性价比，特别是在处理复杂任务时，它的表现更加强大。接下来我们来详细了解一下。

OpenAI o1 是如何工作的？

OpenAI 表示，o1 模型经过训练，能够在回答问题之前进行 “思考”。实际上，这意味着它内置了一种名为“思维链推理”（CoT）的提示工程技术。

当你给 o1 模型一个复杂的提示时，它不会立即做出响应，而是将你要求它执行的操作分解为多个更简单的步骤。然后，它会逐步完成这个思维链，最后再给出完整的答案。

OpenAI 介绍了一些使用 o1-preview 模型来解决复杂问题的例子，比如解码加密文本、解填字游戏，以及正确回答数学、化学和英语问题。这些例子可以让你更好地理解 o1 模型是如何工作的。详细示例请看：重磅！OpenAI o1模型问世，首个会“思考”的AI来啦！

不过，OpenAI 并没有把 o1 模型的完整思维过程展示出来，而是生成了一个简化后的总结。虽然这个总结可以让你大致了解模型是如何解决问题的，但并不能让你看到它如何一步步推导出答案的细节。

虽然用“思考”来形容人工智能有点夸张，但确实反映了 o1 模型在给出答案前需要时间去分析和推理。研究表明，思维链推理（CoT）能够显著提高 AI 模型的准确性，所以 o1 在解决复杂问题时表现比 GPT-4o 更好也就不足为奇了。

通过强化学习（即模型在得到正确答案时会获得奖励）来训练 o1 模型，让它尝试不同的方法，识别并纠正错误，并花时间去找到解决复杂问题的最佳答案。

OpenAI 发现，随着训练时间的延长，以及模型在给出答案前思考时间的增加，o1 的性能会不断提升。这意味着 o1 模型所使用的计算资源越多，它的表现就越好，这也是它价格较高的原因。

除此之外，OpenAI o1 的功能似乎与市面上其他 LLM 大同小异。

GPT-4o 与 OpenAI o1 的对比

在需要逻辑推理的任务方面，OpenAI o1 和 OpenAI o1-mini 明显比 GPT-4o 表现得更好。在一些需要逻辑推理的典型 AI 基准测试中，GPT-4o 的表现非常出色，例如 MMLU，虽然 GPT-4o 的表现已经很出色，但 OpenAI o1 的得分依然更高。

当任务需要非常强的逻辑推理时，GPT-4o 的表现往往不尽如人意。

OpenAI 给出的一个例子是 2024 年美国数学奥林匹克（AIME）试卷。在这份包含 15 道高难度数学题的试卷中，GPT-4o 只答对了两道题，而 o1 模型却答对了 13 道题，成绩排名可以进入美国前 500 名学生之列。

在 Codeforces 等编码竞赛中情况也类似，GPT-4o 的得分仅在第 11 个百分位，而完整的 o1 模型的得分在第 89 个百分位，表现明显更好。

不过，在人工评测中，o1-preview 模型在个人写作方面表现略显逊色，而在文字编辑方面，它与 GPT-4o 不相上下。虽然这看起来不是什么大问题，但如果你对比这些模型的使用成本，就会发现其中的差距。

OpenAI o1-mini 更专业一些，根据 OpenAI 公布的信息，它擅长需要逻辑推理和生成代码的 STEM（科学、技术、工程、数学）问题，但在广泛的常识问题上稍显不足。

在某些特定任务上，它几乎能和完整的 o1 模型媲美，也比 GPT-4o 强，但在处理一般问题时，它却不如 GPT-4o。o1 和 o1-mini 的主要区别可能在于生成响应时允许的思维链推理时间长短。

例如，当 GPT-4o mini 被问到如何前往上海时，它完全没有提到“游泳”作为一种交通方式有多不现实。

而当你给同样的问题给 o1-preview 时，结果就会准确得多。它会逐步思考，在输出答案前一步步推理。它知道游泳去上海是不现实且不安全的。

OpenAI o1 的价格

通过 OpenAI API，GPT-4o 的价格为每百万个输入token 5 美元，输出token 15 美元。GPT-4o mini 则便宜很多，每百万个输入token 0.15 美元，输出token 0.60 美元。

而 o1-preview 的成本则高得多，输入token每百万个 15 美元，输出token 60 美元。即便是 o1-mini，每百万个输入token也需要 3 美元，输出token 12 美元。

由此可见，虽然 o1 模型在逻辑推理方面表现出色，但这种提升是有代价的。如果你不需要 AI 来处理特别复杂的问题，那么使用 o1 模型的成本会非常高，但性能提升可能并不明显。

如何访问 OpenAI o1

现在，你可以通过 ChatGPT 和 API 使用 OpenAI o1-preview 和 OpenAI o1-mini 模型。如果你订阅了 ChatGPT Plus 或 Teams，每周分别可以发送 30 条和 50 条消息。免费用户暂时还不能使用这些模型，但o1-mini 模型估计很快就会开放。

本文链接：https://xhhm.cc/chatgpt_76.html

gpt4帐号 gpt4帐号申请 gpt4帐号升级倒卖gpt帐号多少违法 GPT4.0帐号停用 gpt怎么购买帐号 gpt4帐号购买

OpenAI o1 是什么？o1模型与 CHATGPT-4o 有何不同？

相关文章

如何轻松注册ChatGPT并开始大模型应用开发？

如何在海外轻松注册ChatGPT账号？

如何在安卓设备上找到并安装ChatGPT？

ChatGPT账号如何购买？小白也能轻松上手的注册指南！

如何在遵守版权的前提下使用ChatGPT？

如何在零基础的情况下注册和使用ChatGPT？

如何在线下环境下注册并使用ChatGPT代码？

如何在ChatGPT上注册并达到一百万用户的目标？

网友评论