LangChain初探

需求来源与问题提出

大模型,特别是公有云的超大参数模型,例如70B、130B的模型,往往不会针对特定的领域知识进行微调,原因既有模型自身训练成本的问题,也和把控领域数据的客户有关,他们不愿意共享自己的数据;

私有化部署的大模型,是否就不存在这样的问题呢?不尽然,虽然私有化部署避免了数据回流的安全问题,但是目前阶段,没有那个客户会接受一次训练的成本(软件、硬件和调优服务),何况所谓训练数据的标注也是一个漫长、昂贵的过程。

最近我参与的若干政府项目就遇到了类似难题。

而langchain、向量数据库就能形成一套很好的方案。

原来的问题是:大模型不太行,回答不了我提出的问题;
现在的问题是:你的问题有点烂,没有利用好大模型。

方案的基本思路

专业问题+外挂领域知识库+通用大模型=专业问题+领域大模型

  1. 一个简单的例子
请问XXX
  1. 一个复杂的例子
请问XXX

LangChain介绍

Leave a Reply

Your email address will not be published. Required fields are marked *