OpenAI o1 根据提示编写视频游戏
OpenAI o1 回答了大型语言模型的一个众所周知的棘手问题。
OpenAI o1 在回答之前会思考,并且可以在响应用户之前产生很长的内部思维链。o1 在竞争性编程问题上排名第 89%,在美国数学奥林匹克预选赛中跻身美国前 500 名学生之列,并且在物理、生物和化学问题基准上超过了人类博士水平的准确度。
OpenAI o1 与 GPT4-o 的一些基准比较
下面是OpenAI官网的原文(翻译)
2024年9月12日
介绍 OpenAI o1 预览版 解决复杂问题的新推理模型系列。从9月12日起可用。
我们开发了一种新的AI模型系列,旨在更长时间地思考再作回应。它们能够推理复杂的任务并解决比以前的模型在科学、编程和数学领域更为困难的问题。
今天,我们在ChatGPT和我们的API中发布了该系列的第一个版本。这是一个预览版,并且我们预计会有定期更新和改进。随着此发布,我们也包括了正在开发中的下一个更新的评估。
工作原理 我们训练这些模型在回应之前花更多的时间来思考问题,就像人一样。通过训练,它们学会了完善其思维过程,尝试不同的策略,并识别自己的错误。
在我们的测试中,下一个模型更新在物理、化学和生物学的具有挑战性的基准任务上的表现类似于博士生。我们还发现它在数学和编程方面表现出色。在国际数学奥林匹克(IMO)的资格考试中,GPT-4o 正确解决了仅13%的问题,而推理模型得分为83%。其编程能力在比赛中进行了评估,在Codeforces竞赛中达到了第89百分位。您可以阅读我们的技术研究帖子以了解更多详情。
作为一个早期模型,它目前还没有使ChatGPT有用的一些功能,比如浏览网络获取信息或上传文件和图像。对于许多常见情况,GPT-4o 在短期内会更有能力。
但对于复杂的推理任务来说,这是一个重要的进步,代表了一个新的AI能力水平。鉴于此,我们将计数器重置为1,并将这个系列命名为OpenAI o1。
安全性 作为开发这些新模型的一部分,我们制定了一种新的安全训练方法,利用其推理能力使其遵守安全和对齐指南。通过能够在上下文中推断我们的安全规则,它可以更有效地应用这些规则。
我们衡量安全性的其中一个方式是测试当用户试图绕过这些规则(称为“越狱”)时模型遵循安全规则的情况。在我们最困难的越狱测试之一中,GPT-4o 得分为22(满分为100),而我们的o1-preview模型得分84。您可以在系统卡片和我们的研究帖子中阅读更多相关信息。
为了匹配这些模型的新能力,我们加强了安全工作、内部治理以及与联邦政府的合作。这包括使用我们的准备框架进行严格的测试和评估,最佳级别的红队对抗,以及包括我们的安全与保障委员会在内的董事会审查程序。
为了推进我们对AI安全的承诺,我们最近正式与美国和英国的人工智能安全研究所签订了协议。我们已经开始实施这些协议,包括向研究所提供该模型的研究版本的早期访问权。这是我们合作的一个重要步骤,有助于建立一个在模型公开发布前后的研究、评估和测试流程。
适用对象 这些增强的推理能力可能特别适用于那些在科学、编程、数学及相关领域处理复杂问题的人。例如,o1 可以被医疗研究人员用于注释细胞测序数据,被物理学家用于生成量子光学所需的复杂数学公式,被所有领域的开发者用于构建和执行多步骤的工作流程。
OpenAI o1-mini o1系列在准确生成和调试复杂代码方面表现出色。为了提供一个对开发者更加高效的解决方案,我们还发布了OpenAI o1-mini,这是一个更快、更便宜的推理模型,特别擅长编程。作为一个较小的模型,o1-mini 比 o1-preview 便宜80%,使其成为需要推理但不需要广泛世界知识的应用的强大且经济有效的模型。
如何使用 OpenAI o1 从今天开始,ChatGPT Plus 和 Team 用户可以在ChatGPT中访问o1模型。o1-preview和o1-mini都可以手动选择,启动时,o1-preview每周的消息限制为30条,o1-mini为50条。我们正努力增加这些限制,并让ChatGPT自动为特定提示选择正确的模型。
一张展示新的“o1-preview”模型选项的ChatGPT下拉菜单图片,背景为鲜黄和蓝色抽象图案。ChatGPT企业版和教育版用户将在下周开始获得这两个模型的访问权限。
符合API使用层级5条件的开发者今天就可以在API中开始原型设计,速率限制为每分钟20次请求。我们将在进一步测试后提高这些限制。这些模型的API目前不包括函数调用、流式传输、系统消息支持和其他功能。要开始使用,请查阅API文档。
我们还计划向所有ChatGPT免费用户提供o1-mini的访问权限。
下一步 这是在ChatGPT和API中对这些推理模型的早期预览。除了模型更新外,我们还预计会添加浏览、文件和图像上传以及其他功能,以使其对所有人更有用。
我们还计划继续开发并在GPT系列之外发布新的OpenAI o1系列模型
本文链接:https://xhhm.cc/chatgpt_70.html
OpenAI-o1ChatGPTPlusOpenAI o1chatgpt 中文OpenAIo1OpenAI01chatgpt o1o1-minio1-preview??OpenAI o1-miniOpenAI o1-preview
网友评论