GPT入门之LangChain简介

GPT42023-06-01 10:14:13874

GPT的火爆想必已经不需要我再多说了，但是如果提到LangChain可能很多人并不了解，那么LangChain是个什么呢？

LangChain简单来说就是一个框架，提供了与大语言模型交互的组件和接口，针对不同的场景（个人代理、聊天机器人等），提供实用工具，帮助开发者或者使用者提升语言模型的性能和效率。其核心思想就是将不同组件通过链式结构（Chain）进行链接，实现更为复杂的能力。

当前提供的组件有如下几种：

模型（Model）：LangChain当前已通过集成方式支持多种语言模型或者说平台，比如说OpenAI以及微软；
提示（Prompt）：当你去与GPT交流时，你希望GPT是根据你需要的场景，这时候我们就需要告诉GPT要求扮演的角色以及承担的职责说明，一般是一段文字描述。那么提示就是将你的输入转换为是和语言模型处理格式的技术，当前已经提供了多种提示模板；
索引（Index）：OpenAI的训练数据是到2019年10月，微软的模型训练数据是截止到2021年，那么如果我们想要GPT来告知我们最近的信息，我们就需要提供外接数据源，索引的作用就是将文本数据转为向量嵌入并存储在可检索结构的技术，与大模型交互，提供外接数据。常用的有ES、Mysql以及Redis；
代理（Agent）：代理等于是你的管家，会根据你的输入来判定你的意图，从而决定执行哪些任务。
记忆（Memory）：我们在和GPT交流的时候，我们发现，GPT会结合我们前面的提问和返回进行回答，看起来像是GPT记住了我们的对话，但是当前的GPT仅提供了短期记忆（最新的四轮会话），如果想要实现长期记忆，就需要借助外界数据源，即前面的索引能力。

想要参与到GPT的开发过程中，LangChain属于绕不开的技术栈，后续会逐步对每个组件进行展开。