AI成博士距离替代人又进了一步，OpenAI重磅发布o1

GPT4充值加微信gptchongzhi2024-09-13 22:56:3732

先做个广告：如需代注册GPT4帐号或代充值 GPT4.0（plus会员），添加站长微信：gptchongzhi

昨天夜里还在研究Transformer的Attention机制，还在想这个神奇的东西里面是否隐藏着人类智慧的秘密，结果一大早起来，发现漫天遍野的OpenAI发布了o1的消息，OpenAI o1 可以通过复杂的任务进行推理，并解决比以前的科学、编码和数学模型更难的问题。

推荐使用GPT中文版，国内可直接访问：https://ai.gpt86.top

与人类在回答一个难题之前可能会思考很长时间类似，o1 在尝试解决问题时也会使用一连串的思维。通过强化学习，o1 可以学会磨炼自己的思维链，完善自己使用的策略。看一下他表现：

AIME 2024 数学竞赛中，o1 的预览版达到了 56.7% 的准确率，而正式版更是高达 83.3%。代码竞赛上，o1 的表现也极为抢眼，从 11% 的 GPT-4o 提升到 89%。

更令人震撼的是，在 GPQA-Diamond 这个科学问题测试中，达到了 78% 准确率。

那为什么叫 o1 呢，我们看看官网回答：

For complex reasoning tasks this is a significant advancement and epresents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1。

翻译一下是：对于需要复杂推理的任务来说，这是一个重大的进步，并且代表了人工智能能力的一个新的水平，鉴于此，我们决定将计数器重置为1，并把这个系列命名为OpenAI o1。

那么，o1到底带来哪些变革：

1、重新定义 AI 推理：从快思考到慢思考

o1 系列最大亮点就是它“慢思考”。相比于过去依赖大数据和“快思考”的 GPT 系列，o1 更像是引入了人类解决复杂问题的思维，能通过逐步推理来解决高复杂度问题。

这种从快思考到慢思考转变，是 AI 走向通用人工智能（AGI）的重要一步。

在过去的模型中，我们常常见到一些大模型在简单任务上表现优异，但一旦遇到多步骤的复杂问题，或者需要更多推理和思考的场景时，模型的表现就开始下滑。

而 o1 的突破在于，它不仅能快速给出答案，还能对复杂问题进行深度拆解，推理过程更加稳定和可靠。

这正如 Greg Brockman 所说的：“人们早已发现，提示模型‘逐步思考’可以提升表现，但通过端到端的试错方式来训练模型进行推理，效果更加可靠。

这意味着 OpenAI 成功把复杂推理能力 Scale 到了前所未有的高度。

2、Self-play RL 和 End-to-End 思维链：技术上的飞跃

o1 系列核心技术之一就是 Self-play RL（自我对弈强化学习）。这不就是老顽童的左右互搏吗，当年老顽童练习武功，难觅对手，就想出自己打自己的办法，左右互搏，终于练成绝世武功，哈哈。

这种能力，不仅使得 o1 可以解决以前无法应对复杂任务，还让它在面对变化的情境时能够更加灵活应对。

与 Self-play RL 相结合的，是 end-to-end 的思维链推理。

过去，AI 模型往往需要通过明确提示来逐步指导其思维过程，而 o1 已经具备了自我反思能力，可以在没有外部明确指导的情况下，独立完成复杂的推理任务。

这无疑给模型的训练和使用带来革命性变化。

这些技术进步带来的不仅是理论上的突破，也直接反映在了实际应用上。无论是数学竞赛、科学推理还是代码生成，o1 的表现都极为的出色。甚至在一些过去 AI 模型难以触及领域，比如化学、物理、生物学等，o1 的推理能力也展现了极高的潜力。

3、o1 带来的产业变革

会带来哪些变革呢？

1）o1 可以帮助科研人员解读复杂的生物学数据，为物理学家生成复杂的量子物理公式，甚至在医疗领域进行药物研发。这些能力将极大加速各领域研究进程，甚至可能带来一些颠覆性发现。

2）o1 的发布也引发了工程和开发人员狂欢。推理时间的延长、Context 长度的加倍、模型对提示的敏感性增加，这一切都意味着开发人员在使用 o1 ，需要更高质量提示词和更加精细的 Prompt Engineering。这为相关领域的开发者提供了新的机会和挑战。

3）o1 在推理成本上的变化也引发了讨论。尽管推理成本相对较高，但其强大性能和能力，仍然吸引了大量开发者和企业用户的目光。。可以预见，未来随着模型的不断优化和规模化，推理成本有望下降，AI 将进一步普及并应用到更多场景中。

4、脑力工作者是喜是忧

o1会对就业市场带来冲击吗？

之前人们：

“----ChatGPT 和其他类似的 AI 聊天机器人自然语言处理（NLP）技术，能够理解和分析文本内容，从而实现信息的自动提取和处理。它们可以用于自动化地从大量文档中提取关键信息，如合同条款、客户反馈、研究报告等。

----但是它们在需要深度理解、创造性思维和复杂决策的任务上，人类专家仍然不可或缺。此外，AI 工具的准确性和可靠性也受到其训练数据和算法设计的限制。”

o1的出现完全打破了AI不能深度思考完成复杂决策的认知，那么在很多需要深度思考的高级工作岗位，就会大量被AI替代了，这是时代趋势不可逆啊。

6、怎么办

打不过就加入，那就ALL IN 吧，想起了一个笑话，张三和李四在森林遇到了一只老虎，于是掉头就跑，张三看李四从后面超过他，就说到“你跑的再快也跑不过老虎啊”，李四回答到“我只要能跑过你就行了”。所以深度高AI是不二选择。现在看起来，对于科研型知识型的工作者来说，“提示词Engineering--智能体--大模型Alignment”不被老虎吃掉的的必备技能了。

OpenAI o1官网地址：https://openai.com/o1

chatgpt plus(GPT4)代充值