简介
语言模型越来越受欢迎,因为它们为用户的问题创造了令人印象深刻的连贯答案。 尤其是当用户通过聊天与语言模型交互时,它提供了一种直观的方法来获取他们需要的信息。
通过聊天实现语言模型时,一个普遍的挑战是所谓的根基性,即响应是否植根于、连接或锚定在现实或特定上下文中。 换句话说,根基性是指语言模型的响应是否基于事实信息。
没有根据的提示和响应
使用语言模型生成对提示的响应时,模型必须基于该答案的唯一信息来自训练它的数据,这通常只是来自 Internet 或其他源的大量未文本化文本。

结果很可能是对提示的语法一致且逻辑清晰的响应,但由于它不是基于相关的事实数据,因此缺乏上下文;而且实际上可能不准确,并可能包含虚构的信息。 例如,“我应该使用哪个产品进行 X?”这个问题可能包含虚构产品的详细信息。
有根据的提示和响应
与此相反,您可以使用数据源将提示与一些相关的事实性上下文结合起来。 然后,可以将提示连同基础数据提交到语言模型,以生成具有上下文关联的、相关且准确的响应。

数据源可以是相关数据的任何存储库。 例如,可以使用产品目录数据库中的数据作为“我应该使用哪个产品进行 X?”这个提示的根据,使响应包含目录中存在的产品的相关详细信息。
在本模块中,你将了解如何通过使用自己的数据生成代理,创建基于聊天且具有根据的自有语言模型应用程序。