OpenAI提供了微调API,使开发者能够基于GPT-3.5等模型

GPT42024-04-07 23:29:24334

早在2023年8月,OpenAI就推出了GPT-3.5的自助微调API。从那时起,数千个组织已经使用我们的 API 训练了数十万个模型。
可见,微调可以帮助模型深入理解内容并增强模型针对特定任务的现有知识和能力。
其微调 API 还支持比单个提示所能容纳的更多示例,以实现更高质量的结果,同时降低成本和延迟。
微调的一些常见用例包括训练模型以特定编程语言生成更好的代码、以特定格式总结文本或根据用户行为制作个性化内容。 
而今日凌晨,OpenAI再次推出全新微调功能,让开发人员能够更好地控制他们的微调工作,并宣布新方法来构建与OpenAI的自定义模型。 
这意味着开发者可以开发和训练一个特定于某个组织、业务领域、任务需求的模型,如法律、医疗等特定模型。 
自定义模型可以包含专门的知识库、理解特定类型的数据、执行特定的任务,或者以特定方式响应输入。

OpenAI推出以下关键功能和服务

1.微调API:OpenAI提供了微调API,使开发者能够基于GPT-3.5等模型,通过使用自己的数据集对模型进行微调,以生成更适合特定任务、领域或业务需求的自定义模型。微调可以帮助模型深入理解特定内容,并为特定任务增强模型现有的知识和能力。
2.自定义训练模型程序:OpenAI推出了自定义模型程序,旨在为特定领域训练和优化模型。这一程序允许与OpenAI的研究人员合作,利用他们的技术专长和资源,开发高度专业化的AI模型。这种合作模式特别适合那些需要高度定制化解决方案的组织。
3.辅助微调服务:作为自定义模型程序的一部分,OpenAI提供辅助微调服务。这是一种与OpenAI的技术团队合作的协作努力,利用微调API之外的技术,如额外的超参数和各种参数效率高的微调(PEFT)方法,从而为组织提供针对其特定用例或任务最大化模型性能的支持
4.API和SDK访问:OpenAI提供了API和SDK访问权限,使开发者能够更容易地集成和使用OpenAI的技术。这包括简化的接口来训练、部署和管理自定义模型,以及与现有系统和应用程序的无缝集成
5.第三方平台集成:OpenAI开始支持与第三方平台(如Weights and Biases)的集成,这让开发者能够共享详细的微调数据到他们的技术栈中。这种集成可以帮助开发者更好地跟踪、分析和优化他们的模型训练过程。
6.高级调优和配置能力:OpenAI提供了高级的配置选项,包括从Dashboard配置可用的超参数,而不仅仅是通过API或SDK。这使得开发者可以更细致地控制他们的模型训练和微调过程,以及更容易地调整和重用之前的配置。
7.详细的训练指标和性能反馈:OpenAI的微调服务现在提供了在每个训练周期结束时计算的详细指标,提供了更好的模型性能(如令牌损失和准确性)可见性,并给出了模型泛化能力的反馈。 
8.Playground UI:新推出的Playground UI允许用户侧重比较模型质量和性能,通过人类评估多个模型或微调快照与单一提示的输出。这是一个有用的工具,用于直观地展示不同配置和微调策略对模型输出的影响。
9.强大的研究和开发支持:OpenAI还提供了与其团队的研究人员和AI专家合作的机会,这对于需要定制训练模型的复杂或高度特定的用例尤其有价值。
10.丰富的文档和社区支持:OpenAI提供了丰富的文档、教程和案例研究,以帮助开发者了解如何最有效地使用其工具和服务来构建自定义模型。 

什么是微调

微调(Fine-tuning)是一种基于预训练大型模型的技术,通过对模型参数进行细微调整,使其更好地适应特定业务需求和场景。在这个过程中,模型参数会发生轻微的变化。
微调的主要步骤如下:
  • 初始化:利用预训练语言模型的参数为新模型设置初始值。
  • 添加输出层:根据下游任务的目标(如文本生成、内容摘要等),在预训练模型的顶层添加适当的输出层。
  • 微调训练:使用带有标签的私有数据集,以较小的学习率对整个模型进行训练,直到模型在验证集上的性能达到预期效果。

举个例子,如果我们希望GPT-3.5模型在法律领域表现出更高的专业性和准确性,可以使用大量法律数据集对其进行微调。经过微调后,模型将学会如何更有效地理解、生成和预测法律相关问题。

通过这种方式,微调使得预训练模型能够在特定业务场景中发挥更大的作用,提高其在实际应用中的准确性和可靠性。

定制训练模型

在某些情况下,组织需要从头开始训练一个专门构建的模型,以了解其业务、行业或领域。

完全定制训练的模型通过使用新颖的训练中期和训练后技术修改模型训练过程的关键步骤,注入特定领域的新知识。

通过完全定制训练的模型取得成功的组织通常拥有大量专有数据(数百万个示例或数十亿个令牌),他们希望使用这些数据来向模型传授新知识或针对高度特定的用例的复杂、独特的行为。

例如,Harvey与openAI的合作,为法律专业人士构建了一个定制训练的案例法模型。

该模型是具有复杂推理、广泛领域知识以及超越单一模型调用能力的任务的A系统,如起草法律文件、回答复杂诉讼场景问题以及识别数百份合同之间的重大差异。 

采用定制训练方法,超越了传统的检索增强生成系统(RAG)和通过公共API进行的基础模型微调,使模型能够整合新的知识和推理方式。

企业版需求大幅上涨

OpenAl的COO Brad Lightcap表示,即便越来越多的AI公司提供类似产品,但公司仍然看到对企业版ChatGPT的需求激增。

现在,超过60万人注册使用ChatGPT Enterprise,而1月份才15万左右。

OpenAI最近动作也是放出的如此之多,也希望更多产品和技术能够加速面向大众开放使用!

本文链接:http://lechangxia.cc/gpt4/761.html

chatgptpluschatgpt4.0收费吗微软chatgpt版搜索引擎入口chatgpt需要买会员吗chatgpt4.0概念股chatgpt会员费用chatgpt充值密钥chatgpt注册流程攻略为什么chatgpt无法注册chatgpt能用中国手机号注册吗

相关文章