Science重磅：首个实验证据，证实ChatGPT能够显著提高人类生产力

先做个广告：如需代注册ChatGPT或充值 GPT4.0会员（plus），请添加站长微信：gpthuiyuan

撰文丨王聪

推荐使用GPT中文版,国内可直接访问：https://ai.gpt86.top

机器学习（Machine Learning）算法的进步产生了通常所说的人工智能（Artificial Intelligence，AI）。如今，人工智能（AI）已经在科学和社会上的发展和应用已经取得了巨大的进步。

但快速发展的人工智能（AI），是否会让人类黯然失色？还是会找到一种安全、公平的合作方式，帮助人类走得更远？

2023年7月13日，国际顶尖学术期刊 Science 发表了一个特别专题：A machine-intelligent world。

该专题通过一系列文章，讨论了人工智能给我们带来的好处，例如，促进我们对动物间交流的理解，从而帮助保护和饲养动物；还可以帮助药物开发和应用。此外，人工智能算法在医学领域得到了广泛的发展和部署，以医疗机器人的形式改善患者的治疗和康复，并作为促进诊断和治疗建议的平台。但快速发展的人工智能也带来了一些担忧，人们担心人工智能会出现偏见和歧视，因此，需要找到开发无偏见机器学习的方法，开发能够评估偏见和实现健康公平的人工智能模型，从而最大限度地让人工智能为所有人带来好处。

在这一专题中，包括了来自麻省理工学院（MIT）的一篇题为：Experimental evidence on the productivity effects of generative artificial intelligence（生成式人工智能对生产力影响的实验证据）的研究论文。

这项研究通过实验验证了ChatGPT这种生成式人工智能（Generative AI）对生产力的影响。对453名受过大学教育的专业人士的实验结果显示，使用ChatGPT能够显著提高生产力，提高完成任务的质量，降低完成任务所花费的时间。此外，专业技能较弱的人从ChatGPT中受益更大，这表明人工智能还有助于减少生产力不平等的问题。

生成式人工智能（Generative AI）是指人工智能（AI）的一个分支，它专注于根据从大型数据集中学习的模式和示例创建或生成新的内容，例如文本、图像甚至音乐。它利用深度学习模型和算法来生成模仿人类创作的原始输出。生成式人工智能系统可以通过以创新的方式结合现有数据和模式来产生新颖而独特的内容，通常没有明确的指示或预定义的规则。这项技术有可能彻底改变各个领域的创造性任务、内容生成和问题解决。

这些强大的生成式人工智能技术的出现引发了关于它们对劳动力影响的重要问题。这些自动化技术既可以取代人类工人，也可以补充他们，从而对就业、生产力和不平等产生不同的影响。

ChatGPT，是由 OpenAI 公司于2022年11月30日发布的一款聊天机器人模型，是生成式人工智能技术进展的代表性成果，ChatGPT能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流。

自推出以来，ChatGPT强大的能力备受关注，那么，ChatGPT能否以及如何人们的生产力呢？

从历史上看，自动化已经取代了工厂或执行常规计算任务的人类工人。那么，像ChatGPT这样的生成式人工智能（Generative AI）是否会通过淘汰受过良好教育的专业人员来扰乱劳动力市场，或者这些工具是否会通过补充他们的技能来提高生产力?

在这项研究中，共计453名受过大学教育的专业人士参与实验，他们的职业包括市场营销人员、基金申请者、顾问、数据分析师、人力资源专家和经理。他们被分配了两项职业特定和激励性写作任务，这些任务包括撰写新闻稿、简短报告、分析计划和电子邮件，这些任务通常需要花费20-30分钟时间完成，旨在模拟这些职业中执行的真实任务。在这项实验中，参与者被给予高额奖金，以激励其高质量完成任务，基本报酬是10美元，再加上最高14美元的产出质量奖，平均每小时的总报酬为17美元。完成两项任务后，这些书面作品由经验丰富的专业人士进行盲审评分，每个作品由三人评分，这些评审者与实验参与者为同一职业工作者。评分分为四个方面：整体评分、写作质量、内容质量、独创性。

在实验中，50%的参与者被随机分配到实验组，50%的参与者被随机分配到对照组。实验组被要求在第一项任务和第二项任务之间注册ChatGPT，并指导他们如何使用，他们还被告知如果觉得ChatGPT有用，可以在第二项任务中使用。对照组则被要求注册编辑器Overleaf，他们没有被告知可以在第二项任务中使用Overleaf。参与者在第一项任务中的表现被作为基准能力的衡量标准。

实验结束后，研究团队发现，实验组中92%的参与者成功注册了ChatGPT，81%的人选择将其用于第二项任务，他们给予ChatGPT的自我评估有用性的平均得分为4.4分（满分为5分）。

实验结果显示，使用ChatGPT大大改善了参与者处理任务时所花费的时间和评分等级，对照组平均花费27分钟完成任务，而实验组减少了11分钟。此外，相比对照组，实验组完成任务的总体评分、写作质量、内容质量和独创性均有明显提高。

该研究还发现，在第一项任务中完成任务评分较低的参与者，CahtGPT帮助提高了他们的评分成绩（评分提高了1-2分），还显著减少了他们花费的时间（时间减少约10分钟）。在第一项任务中评分较高的人，在使用ChatGPT后继续保持了高评分成绩，但同样能够显著减少花费的时间（时间减少约10分钟）。

因此，ChatGPT能够帮助提高生产力，尤其是对那些写作和沟通能力较差的人特别有效。ChatGPT可以通过为个人提供强大的创意生成技能和将这些想法写下来的能力，从而扩大其在劳动力市场上的竞争力。

ChatGPT对使用者有价值的一个有力指标是，他们在实验结束后的实际工作中是否继续使用它。为了追踪这一点，研究团队在参与者完成初始调查的2周和2个月后对他们进行了随访，随访回复率分别为92%和83%。结果显示，在2周随访时，34%的实验组在一周内的工作中使用了ChatGPT，对照组的这一比例为18%。在2个月随访时，42%的治疗组在一周内的工作中使用了ChatGPT，对照组的这一比例为27%。这种差距的持续存在，表明了ChatGPT在真正的专业工作中的传播仍处于非常早期的阶段，由于缺乏对该ChatGPT的知识或经验，很多人的使用受到阻碍。

这些继续使用ChatGPT的人表示，他们用ChatGPT完成各种各样的任务，例如写推荐信、回复客户服务请求、进行头脑风暴、起草电子邮件草稿和编辑。而不使用ChatGPT的人可以分为大体占比相等的三类：ChatGPT在自己的工作中没有用、不知道ChatGPT或没有ChatGPT账号、自己的工作场所不允许或无法使用ChatGPT。

这项研究表明，受过大学教育的专业人士在执行专业协作任务时，ChatGPT大大提高了他们的工作效率。这种生成式人工智能工具提高了较低能力的人的输出质量，减少了所有能力水平的人在任务中花费的时间。因此，ChatGPT减少了生产力的不平等，而且它已经被许多人在实际工作中所使用，并产生了实实在在的影响。

总的来说，ChatGPT的到来开启了一个人工智能技术的新时代，只有时间和未来的研究才能充分揭示其对经济和劳动力市场的具体影响。而这项研究为回答这些问题迈出了第一步，证实了生成式人工智能技术将显著影响，并且已经显著影响了人类使用者。

论文链接：

https://www.science.org/doi/10.1126/science.adh2586

chatgpt plus(GPT4)代充值