探索LangChain的chat代理

#分析 #机器学习 #ai # chatgpt #人工智能代理

查看配置文件

查看更多文章

本博客将探讨其中之一 LangChain的代理商:the 带有反应逻辑的聊天代理. 有很多 LangChain 中提到的代理人 LangChain文档但是，我们只关注反应代理.

那么什么是反应代理按 LangChain文档?

此代理使用反应框架，仅根据工具的描述来确定使用哪个工具. 可以提供任意数量的工具. 此代理要求为每个工具提供描述.
注意:这是最通用的动作剂.

本博客还介绍了一个聊天代理的简单实现，它使用了打包在其中的3个工具 LangChain v.0.0.220. 欲知更多有关游乐场代理的详情，请参阅下文.

主要思想

的带有反应逻辑的聊天代理可以访问特定的工具列表和大型语言模型(LLM). 在收到用户生成的消息后，聊天代理会询问LLM哪个工具最适合回答这个问题. 它也可能发送最终答案.

它可能会选择一个工具. 如果是这种情况，则针对工具执行问题或关键字. 然后，该工具返回一个输出，然后用于LLM再次计划下一步要做什么:要么选择另一个工具，要么给出最终答案.

因此，代理使用LLM来计划在循环中下一步做什么，直到找到最终答案或放弃.

聊天代理流程

下面是根据聊天代理的流程 LangChain 实现:

在web或命令行应用程序的典型场景中，流程可以分为两个部分:

设置流:用于设置代理的主要部分，包括工具和LLM.
执行流程:由两个循环组成. 外部循环处理用户输入，内部循环处理代理与工具和LLM的交互.

理解执行流

设置流程通常只是主执行流程的顺序前奏:

该流执行以下步骤:

接受 用户输入. 用户输入通常是通过web、移动设备或命令行UI输入的问题.
代理开始工作:它要求法学硕士使用哪种工具来给出最终答案.
在这个阶段， 第一进程网关 达到. 它有三个输出:
- 使用工具法学硕士决定使用一个特定的工具. 在下面的“工具回复”中继续该流程
- 给出基于法学硕士的答案法学硕士想出了最后的答案
- 回答不明白法学硕士的答案是不确定的. 进程在这里退出，并出现错误.
工具回复:向第二个网关发送消息
的 第二工作流网关 达到. 它有三种可能的结果:
—通常情况下，工具的输出被路由到LLM. 我们回到代理循环的初始步骤.
-如果执行的工具被标记为“返回工具，工具的响应就是最终的答案
-错误条件发生:如果工具抛出错误或超时发生或达到最大尝试量，则进程退出并出现错误.

一个非常简单的维基百科，DuckDuckGo, Arxiv代理

我们已经构建了一个非常简单的代理，它使用了三个内置的 LangChain 代理人:

维基百科 (备受喜爱的在线百科全书)
Arxiv (科学论文的在线档案)
DuckDuckGo (一个注重隐私的搜索引擎)

我们使用了这三个代理，因为它们在LangChain中是开箱即用的，也不需要任何注册或付费订阅.

这个命令行应用程序可以用来谈论不同的主题，并提出以下问题:

唐老鸭是谁??
今天伦敦的天气怎么样?
爱因斯坦是谁??
谁将是下一届美国总统选举的总统候选人?
2020年十大网博靠谱平台神经网络注意力层最相关的出版物是哪些?

以下是与该工具互动的摘录:

我们尝试用颜色编码工具的输出:

绿色:响应成功
红色:错误消息和一些解释
blue intermediate step; typically mentioning the tool and the question sent to the tool

实现

我们的聊天应用程序可以在这个GitHub存储库中找到:

GitHub - gilfernandes/代理_playground:一个基于LangChain代理的小演示项目.

小型演示项目，具有基于LangChain的功能代理. - GitHub - gilfernandes/代理_playground:小演示…

github.com

主代理代码已输入代理_playground.py

使用以下代码配置代理:

类配置():
    """
    包含LLM的配置.
    """
    模型= 'gpt-3.5-turbo-16k”
    # model = 'gpt-4'
    llm = ChatOpenAI(model=model, temperature=0)

cfg = Config()

我们使用gpt-3.你可以看到5个API.

在下面这个函数中设置代理:

def create_代理_executor(cfg: Config . cfg, action_detector_func:可调用的, verbose: bool = False) -> 代理Executor:
    """
    设置代理与三个工具:维基百科，arxiv, duckduckgo搜索
    :param cfg LLM的配置.
    :param action_detector_funcc一个更灵活的输出解析器实现, 更善于从回应中猜测工具.
    :param verbose是否在控制台上有更多输出.
    """
    Tools = load_tools(["wikipedia"， "arxiv"， "ddg-search"]， llm=cfg.llm)
    代理_executor: 代理Executor = initialize_代理(
        工具, 
        cfg.llm, 
        代理= 代理Type.CHAT_ZERO_SHOT_REACT_DESCRIPTION, 
        verbose =详细
    )
    代理 = 代理_executor.代理
    代理.output_parser = ExtendedChatOutputParser(action_detector_func)
    返回代理_executor

你可以看到三个工具"维基百科", “arxiv”, 和“ddg-search”在这里加载，代理执行器在这里使用 CHAT_ZERO_SHOT_REACT_DESCRIPTION类型.

您可能还注意到，我们添加了一个自定义输出解析器. 输出解析器的任务是解析来自LLM的输出. 我们希望有一个更灵活的输出解析器实现，以便更好地检测要使用的工具——这主要是因为我们在测试期间得到了大量的错误. 这是该工具的实现，可以在文件中找到: chat_output_parser.py.

这是输出解析器的自定义实现:

类ExtendedChatOutputParser (ChatOutputParser):

    action_detector_func:可调用的

    def __init__(self, action_detector_func:可调用的):
        super ().__init__ (action_detector_func = action_detector_func)

    def parse(self, text: str) -> Union[代理Action, 代理Finish]:
        incles_answer = FINAL_ANSWER_ACTION在文本

        试一试:
            动作=自我.action_detector_func(文本)
            响应= json.负载(行动.带())
            incles_action =响应中的"action"
            如果包括答案和包括动作:
                提高OutputParserException (
                    "解析LLM输出生成最终答案"
                    "和一个可解析的动作:{text}"
                )
            print(get_colored_text(f"Tool: {response['action']}"， "blue"))
            print(get_colored_text(f"Input: {response['action_input']}"， "blue"))
            print ()
            返回代理Action (
                响应“行动”,响应.获取("action_input"，{})，文本
            )

        例外情况如下:
            如果没有包括答案:
                引发OutputParserException(f"无法解析LLM输出:{text}: {str(e)}")
            返回代理Finish (
                {“输出”:文本.分割(FINAL_ANSWER_ACTION) [1].带()},文本
            )

此实现允许指定用于检测动作的自定义函数，或者换句话说，指定下一步使用哪个工具.

我们编写的用于从LLM输入检测下一个的函数可以在代理_playground.py:

def action_detector_func(文本):
    """
    方法，该方法试图更好地理解LLM的输出.
    参数文本:来自LLM响应的文本.
    :返回一个json字符串，其中包含接下来要查询的工具的名称和该工具的输入.
    """
    分割=文本.分割(“的”)
    if len(splits) > 1:
        #原始实现+ json片段删除
        返回重新.Sub (r"^json"， ""，拆分[1])
    其他:
        Lower_text =文本.低()
        Tool_tokens = ["wiki"， "arxiv"， "duckduckgo"]
        Token_tool_mapping = {
            “维基”:“维基百科”,
            :“arxiv arxiv”,
            :“duckduckgo duckduckgo_search”
        }
        对于tool_tokens中的token:
            如果token在lower_text中:
                返回json.转储({
                    “行动”:token_tool_mapping(令牌),
                    “action_input”:文本
                })
        抛出OutputParserException('无法找到wiki或arxiv或duckduckgo操作或最终答案').')

在这个函数中, 我们不仅要查找预期的JSON输出，还要查找可能指示使用下一个工具的单词.

使用法学硕士的一个问题是，它们在某种程度上是不可预测的，并且以意想不到的方式表达自己, 因此，这个函数只是试图以一种更灵活的方式捕捉法学硕士想要传达的信息.

观察

我们注意到，LangChain使用了一个特殊的提示符来查询LLM如何对输入做出反应. 这个库中使用的提示符如下:

尽你所能回答以下问题. 您可以使用以下工具:

维基百科:维基百科的包装. 当你需要回答十大网博靠谱平台人的一般性问题时很有用, 的地方, 公司, 事实。, 历史事件, 或者其他科目. 输入应该是一个搜索查询.
arxiv: arxiv的包装.当你需要回答有关物理的问题时非常有用, 数学, 计算机科学, 定量生物学, 定量金融学, 统计数据, 电气工程, 和经济学从科学文章在arxiv.org. 输入应该是一个搜索查询.
duckduckgo_search: DuckDuckGo搜索的包装. 当你需要回答有关当前事件的问题时非常有用. 输入应该是一个搜索查询.

使用这些工具的方法是指定一个json blob.
具体地说, 这个json应该有一个' action '键(包含要使用的工具的名称)和一个' action_input '键(包含工具的输入到这里).

“action”字段中应该包含的值只有:维基百科、arxiv、duckduckgo_search

JSON_BLOB美元应该只包含一个动作，不返回多个动作的列表. 下面是一个有效的JSON_BLOB美元的例子:

```
{
    “行动”:$ TOOL_NAME
    “action_input”:$输入\ n}
```

始终使用以下格式:

问题:您必须回答的输入问题
思想:你应该时刻想着要做什么
行动:
```
JSON_BLOB美元
```
观察:行动的结果
... (这个想法/行动/观察可以重复N次)
心想:我现在知道最后的答案了
最终答案:原始输入问题的最终答案
开始! 提醒你在回复时一定要使用准确的“最终答案”.'

提示信息通过系统消息发送给LLM，同时发送的还有来自工具响应的问题或观察结果.

我们想知道你如何指导法学硕士在这种情况下的行为.

最终的想法

在这个故事中, 我们试图描述一个简单的聊天代理是如何工作的，并试图理解聊天代理的内部机制. 您可以使用额外的工具来增强大型语言模型的功能，这些工具可以将法学硕士的知识扩展到他们通常无法访问的领域. 法学硕士不是在旧的知识基础上进行培训，而是使用公开可用的信息. 如果你想与法学硕士一起获取前沿新闻，代理是一个不错的选择.

你可以和代理人做更多的事情, 比如让他们参与对抗性场景或代码库, 但我们将在接下来的故事中关注这些场景.

探索LangChain的chat代理

分享

主要思想

聊天代理流程

理解执行流

一个非常简单的维基百科，DuckDuckGo, Arxiv代理

实现

观察

最终的想法

相关的帖子

由Fuzzy Labs发布

模糊实验室发布免费工具，导出谷歌分析数据到谷歌BigQuery

由高地营销发布

为什么你需要为谷歌分析你的网站

由高地营销发布

转化率优化的重要提示

由伍德赫斯特咨询公司发布

人工智能在交易监控中——一石二鸟

由伍德赫斯特咨询公司发布

机器学习在可预见的未来

由伍德赫斯特咨询公司发布

你不仅仅是你的信用评分

由伍德赫斯特咨询公司发布

了解整体情况

McCann Manchester发布

2020年SEO增长的六个重要提示

由高地营销发布

精益用户体验方法

由伍德赫斯特咨询公司发布

不完美的智能，第一部分-垃圾数据

澳门十大正规赌博娱乐平台