先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
昨天夜里还在研究Transformer的Attention机制,还在想这个神奇的东西里面是否隐藏着人类智慧的秘密,结果一大早起来,发现漫天遍野的OpenAI发布了o1的消息,OpenAI o1 可以通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
与人类在回答一个难题之前可能会思考很长时间类似,o1 在尝试解决问题时也会使用一连串的思维。通过强化学习,o1 可以学会磨炼自己的思维链,完善自己使用的策略。看一下他表现:
AIME 2024 数学竞赛中,o1 的预览版达到了 56.7% 的准确率,而正式版更是高达 83.3%。代码竞赛上,o1 的表现也极为抢眼,从 11% 的 GPT-4o 提升到 89%。
更令人震撼的是,在 GPQA-Diamond 这个科学问题测试中,达到了 78% 准确率。
那为什么叫 o1 呢,我们看看官网回答:
For complex reasoning tasks this is a significant advancement and epresents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1。
翻译一下是:对于需要复杂推理的任务来说,这是一个重大的进步,并且代表了人工智能能力的一个新的水平,鉴于此,我们决定将计数器重置为1,并把这个系列命名为OpenAI o1。
那么,o1到底带来哪些变革:
1、重新定义 AI 推理:从快思考到慢思考
o1 系列最大亮点就是它“慢思考”。相比于过去依赖大数据和“快思考”的 GPT 系列,o1 更像是引入了人类解决复杂问题的思维,能通过逐步推理来解决高复杂度问题。
这种从快思考到慢思考转变,是 AI 走向通用人工智能(AGI)的重要一步。
在过去的模型中,我们常常见到一些大模型在简单任务上表现优异,但一旦遇到多步骤的复杂问题,或者需要更多推理和思考的场景时,模型的表现就开始下滑。
而 o1 的突破在于,它不仅能快速给出答案,还能对复杂问题进行深度拆解,推理过程更加稳定和可靠。
这正如 Greg Brockman 所说的:“人们早已发现,提示模型‘逐步思考’可以提升表现,但通过端到端的试错方式来训练模型进行推理,效果更加可靠。
这意味着 OpenAI 成功把复杂推理能力 Scale 到了前所未有的高度。
2、Self-play RL 和 End-to-End 思维链:技术上的飞跃
o1 系列核心技术之一就是 Self-play RL(自我对弈强化学习)。这不就是老顽童的左右互搏吗,当年老顽童练习武功,难觅对手,就想出自己打自己的办法,左右互搏,终于练成绝世武功,哈哈。
这种能力,不仅使得 o1 可以解决以前无法应对复杂任务,还让它在面对变化的情境时能够更加灵活应对。
与 Self-play RL 相结合的,是 end-to-end 的思维链推理。
过去,AI 模型往往需要通过明确提示来逐步指导其思维过程,而 o1 已经具备了自我反思能力,可以在没有外部明确指导的情况下,独立完成复杂的推理任务。
这无疑给模型的训练和使用带来革命性变化。
这些技术进步带来的不仅是理论上的突破,也直接反映在了实际应用上。无论是数学竞赛、科学推理还是代码生成,o1 的表现都极为的出色。甚至在一些过去 AI 模型难以触及领域,比如化学、物理、生物学等,o1 的推理能力也展现了极高的潜力。
3、o1 带来的产业变革
会带来哪些变革呢?
1)o1 可以帮助科研人员解读复杂的生物学数据,为物理学家生成复杂的量子物理公式,甚至在医疗领域进行药物研发。这些能力将极大加速各领域研究进程,甚至可能带来一些颠覆性发现。
2)o1 的发布也引发了工程和开发人员狂欢。推理时间的延长、Context 长度的加倍、模型对提示的敏感性增加,这一切都意味着开发人员在使用 o1 ,需要更高质量提示词和更加精细的 Prompt Engineering。这为相关领域的开发者提供了新的机会和挑战。
3)o1 在推理成本上的变化也引发了讨论。尽管推理成本相对较高,但其强大性能和能力,仍然吸引了大量开发者和企业用户的目光。。可以预见,未来随着模型的不断优化和规模化,推理成本有望下降,AI 将进一步普及并应用到更多场景中。
4、脑力工作者是喜是忧
o1会对就业市场带来冲击吗?
之前人们:
“----ChatGPT 和其他类似的 AI 聊天机器人自然语言处理(NLP)技术,能够理解和分析文本内容,从而实现信息的自动提取和处理。它们可以用于自动化地从大量文档中提取关键信息,如合同条款、客户反馈、研究报告等。
----但是它们在需要深度理解、创造性思维和复杂决策的任务上,人类专家仍然不可或缺。此外,AI 工具的准确性和可靠性也受到其训练数据和算法设计的限制。”
o1的出现完全打破了AI不能深度思考完成复杂决策的认知,那么在很多需要深度思考的高级工作岗位,就会大量被AI替代了,这是时代趋势不可逆啊。
6、怎么办
打不过就加入,那就ALL IN 吧,想起了一个笑话,张三和李四在森林遇到了一只老虎,于是掉头就跑,张三看李四从后面超过他,就说到“你跑的再快也跑不过老虎啊”,李四回答到“我只要能跑过你就行了”。所以深度高AI是不二选择。现在看起来,对于科研型知识型的工作者来说,“提示词Engineering--智能体--大模型Alignment”不被老虎吃掉的的必备技能了。
OpenAI o1官网地址:https://openai.com/o1
本文链接:https://lechangxia.cc/gpt4/873.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介