北京时间2024年9月13日凌晨,OpenAI全新力作o1模型震撼问世,它的降临犹如一道闪电,瞬时划破了夜晚长空的宁静,预示着AI领域新时代的黎明已经到来!为何命名为o1?
据OpenAI官方介绍,由于o1在复杂推理任务上取得了前所未有的进步,代表了人工智能模型的新水平。因此,他们决定重置计数器,从1开始计数,将这一系列命名为OpenAI o1,作为OpenAI新一代旗舰模型Orion(猎户座)的首发,寓意着这是一个全新的开始。OpenAI o1官网地址:https://openai.com/o1碾压GPT-4o,o1展现惊人实力
与之前的GPT-4o相比,o1模型在多个方面展现出了惊人的实力。
- 图一,Competition Math(AIME 2024) 是一个高水平的数学竞赛,GPT4o准确率为13.4%,o1 预览版是56.7%,o1正式版是83.3%。
- 图二,Competition Code(CodeForces) 是一个高水平的代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版是89%。
- 图三,PhD-Level Science Questions(GPQA Diamond) 是博士级科学问题,GPT4o准确率是56.1,人类专家水平是69.7,o1达到了惊人的78%。
o1的慢思考与深度推理
o1模型之所以能够达到如此高的水平,是基于Self-play RL技术实现了人类所擅长的慢思考和深度推理模式。
这使o1模型有效解决了以往大模型在复杂任务处理上的失智问题,尤其是擅长数学和编码。但新的问题就来了,那就是回复速度慢。
就像人类在回答难题之前,可能会思考很长时间,o1在解决问题时也会像人类一样,不断分析、思考和纠错,因此比较消耗时间。但不管怎样,模型输出结果令人叹服,有网友测试为证!
“这是中国2024年9月9日(星期一)开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?”
虽然在数学推理和编码方面,o1碾压以往的一众模型,但在文章写作和编辑等自然语言任务中,o1的表现并不如GPT-4o,主要是因为o1在处理这类任务时,会花费大量时间进行深度思考,导致效率较低。
OpenAI在推广这款模型时也显得相当谨慎。他们权衡了用户体验、竞争优势以及对思维链进行监控等多种因素后,决定不向用户展示原始思维链,避免模型思维链对用户产生不良影响。
同时,OpenAI也在努力调整o1模型,使其能够在回答中展示思维链的摘要,以提高用户体验。
本文链接:http://lechangxia.cc/gpt4/878.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介