OpenAI没有召开发布会而是直接在X上发布了新模型——OpenAI O1.
和以往的命名规则不同,这次的命名直接是O1,仿佛OpenAI将这次大模型当做了自己的起点
官网也发布了介绍文档并同时开放实验版(详情见如何使用)
并附有使用情况的介绍视频
以下是中文翻译版,文末附有英文原版
OpenAI O1的工作原理
我们训练这些模型在回应之前花更多时间思考问题,就像人类一样。通过训练,它们学会如何优化自己的思考过程,尝试不同的策略,并识别错误。
在我们的测试中,下一个模型更新版本在物理、化学和生物学的挑战性基准任务上表现得与博士生相当。我们还发现它在数学和编程方面表现优异。在国际数学奥林匹克(IMO)资格考试中,GPT-4o仅能正确解决13%的问题,而推理模型得分达到了83%。在编程能力的评估中,它在Codeforces竞赛中达到了89%的百分位。您可以在我们的技术研究帖子中阅读更多相关信息。
作为早期模型,它还没有许多使ChatGPT变得实用的功能,例如浏览网页获取信息、上传文件和图片等。在许多常见情况下,GPT-4o在短期内会表现得更为出色。
但对于复杂的推理任务来说,这是一项重大进步,代表了AI能力的新水平。因此,我们将计数器重置为1,并将这一系列命名为OpenAI o1。
OpenAI的安全性
在开发这些新模型的过程中,我们提出了一种新的安全培训方法,利用其推理能力使其遵守安全和对齐指南。通过能够在上下文中推理我们的安全规则,它可以更有效地应用这些规则。
我们的一种安全性衡量方法是测试模型在用户试图绕过安全规则时(即“越狱”)能否继续遵守其安全规则。在我们最难的越狱测试之一中,GPT-4o得分为22(在0-100的范围内),而我们的o1-preview模型得分为84。您可以在系统卡和我们的研究帖子中阅读更多相关信息。
为了匹配这些模型的新功能,我们加强了安全工作、内部治理以及与联邦政府的合作。这包括使用我们的《准备框架》(新窗口打开)、最佳的红队测试以及董事会级别的审查流程(包括我们的安全与安保委员会)进行严格的测试和评估。
为了推进我们对AI安全的承诺,我们最近与美国和英国的AI安全研究机构正式签署了协议。我们已经开始落实这些协议,包括为这些研究机构提供模型的研究版本早期访问权限。这是我们合作中的重要第一步,有助于建立研究、评估和测试未来模型的流程,确保它们在公开发布前后经过审慎的测试。
适用人群
这些增强的推理能力特别适合于解决科学、编程、数学等领域的复杂问题。例如,o1可以被医疗研究人员用于注释细胞测序数据,物理学家用于生成量子光学所需的复杂数学公式,以及各领域的开发人员用于构建和执行多步骤的工作流程。
OpenAI o1-mini
o1系列在生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,我们还推出了OpenAI o1-mini,这是一款更快、更便宜的推理模型,尤其在编程方面表现突出。作为较小的模型,o1-mini比o1-preview便宜80%,使其成为需要推理但不需要广泛世界知识的应用程序中的强大且经济实惠的模型。
如何使用OpenAI o1 ?
从今天开始,ChatGPT Plus和团队用户将能够在ChatGPT中访问o1模型。用户可以在模型选择器中手动选择o1-preview和o1-mini。上线时,o1-preview的每周消息限制为30条,o1-mini为50条。我们正在努力增加这些限制,并使ChatGPT能够自动为给定的提示选择合适的模型。
ChatGPT企业版和教育版用户将于下周开始获得这两种模型的访问权限。
符合API使用第5级(新窗口打开)条件的开发者今天起可以在API中开始使用这两种模型进行原型开发,速率限制为每分钟20个请求。我们正在进行额外测试,以增加这些限制。目前,这些模型的API不支持函数调用、流式传输、系统消息等功能。要开始使用,请查阅API文档(新窗口打开)。
我们也计划向所有ChatGPT免费用户提供o1-mini的访问权限。
接下来是什么?
这是ChatGPT和API中这些推理模型的早期预览。除了模型更新外,我们还预计会增加浏览、文件和图片上传等功能,使其对所有用户更加有用。
此外,我们计划继续开发并发布GPT系列的新模型,同时推出全新的OpenAI o1系列。
OpenAI o1官网地址:https://openai.com/o1
本文链接:http://lechangxia.cc/gpt4/879.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介