OpenAI o1重磅登场,OpenAI o1官网地址:https://openai.com/o1

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

北京时间2024年9月13日凌晨,OpenAI全新力作o1模型震撼问世,它的降临犹如一道闪电,瞬时划破了夜晚长空的宁静,预示着AI领域新时代的黎明已经到来!

为何命名为o1?

据OpenAI官方介绍,由于o1在复杂推理任务上取得了前所未有的进步,代表了人工智能模型的新水平。因此,他们决定重置计数器,从1开始计数,将这一系列命名为OpenAI o1,作为OpenAI新一代旗舰模型Orion(猎户座)的首发,寓意着这是一个全新的开始。
OpenAI o1官网地址:https://openai.com/o1

碾压GPT-4o,o1展现惊人实力

与之前的GPT-4o相比,o1模型在多个方面展现出了惊人的实力。


推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

上图感受一下:
  • 图一,Competition Math(AIME 2024) 是一个高水平的数学竞赛,GPT4o准确率为13.4%,o1 预览版是56.7%,o1正式版是83.3%。
  • 图二,Competition Code(CodeForces) 是一个高水平的代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版是89%。
  • 图三,PhD-Level Science Questions(GPQA Diamond) 是博士级科学问题,GPT4o准确率是56.1,人类专家水平是69.7,o1达到了惊人的78%。

o1的慢思考与深度推理

o1模型之所以能够达到如此高的水平,是基于Self-play RL技术实现了人类所擅长的慢思考和深度推理模式。


这使o1模型有效解决了以往大模型在复杂任务处理上的失智问题,尤其是擅长数学和编码。但新的问题就来了,那就是回复速度慢


就像人类在回答难题之前,可能会思考很长时间,o1在解决问题时也会像人类一样,不断分析、思考和纠错,因此比较消耗时间。
但不管怎样,模型输出结果令人叹服,有网友测试为证!



之前有一个坑遍所有大模型的调休问题:
“这是中国2024年9月9日(星期一)开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?”

中间推理分析太长,省略。。。。。

o1思考了整整30秒以后,给出了十分准确的答案。
整个推理过程就是一个字:绝!

o1 不是六边形战士,它并不适合所有场景!


虽然在数学推理和编码方面,o1碾压以往的一众模型,但在文章写作和编辑等自然语言任务中,o1的表现并不如GPT-4o,主要是因为o1在处理这类任务时,会花费大量时间进行深度思考,导致效率较低。


OpenAI在推广这款模型时也显得相当谨慎。他们权衡了用户体验、竞争优势以及对思维链进行监控等多种因素后,决定不向用户展示原始思维链,避免模型思维链对用户产生不良影响。


同时,OpenAI也在努力调整o1模型,使其能够在回答中展示思维链的摘要,以提高用户体验。


chatgpt plus(GPT4)代充值

本文链接:https://lechangxia.cc/gpt4/878.html

OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介

相关文章