你要了解的2种AI思维链

我们使用的AI助手，一般是经过了预训练和微调这2个步骤，尽管训练出的模型能回答许多通用类问题，但是在遇到复杂问题时还是束手无策。

直到有人提出了思维链方式，才解决了模型在面对复杂问题时的推理能力。

1、什么是思维链

思维链（Chain of Thought, CoT）是用于提高AI模型推理能力的方式。其核心原理就8个字：化繁为简、逐个击破。

思维链的工作原理是，模拟人类思考问题的过程，通过将复杂的问题逐步分解，然后逐个向前解决这些简单问题，从而得出最终答案。

2、实现智能体的方式

智能体（AI Agent）用于更加智能更加强调推理的场景，思维链便是用于AI Agent的场景，在这种场景下可以发挥它的优势。

在AI Agent领域里，常见的实现思维链的机制有2种，Plan-and-Executor机制和ReAct机制。

2.1、Plan-and-Executor机制

Plan-and-Executor机制是分离规划和执行这2个环节。它将问题解决过程分为两个阶段：规划和执行。

规划阶段：

在这个阶段，主要是在智能体里分析问题，制定一个详细的解决方案计划。这个阶段通常会涉及到大量的计算过程，用来确定出最优的行动计划。规划的结果是：输出一个具体的行动计划。

执行阶段：

在这个阶段，智能体按照规划阶段生成的行动计划去逐步执行每个步骤。并在执行过程中监控和调整，确保计划的顺利执行。

优点：

这种机制的特点就是规划和执行的分离，这种分离可以使每个阶段更加专注于当前任务，从而提高效率。适用于需要复杂度较高，需要提前做复杂规划的任务。

缺点：

在执行过程中，可能存在不确定因素，这种方式因为是提前规划好的，所以可能不适应变化，需要频繁调整计划。

举例说明Plan-and-Executor步骤

比如，我想知道2024年周杰伦最新的演唱会是时间和地点是什么，通过Plan-and-Executor机制，会被拆解成以下步骤：

计划阶段：

1. 在搜索引擎上查找“2024年周杰伦最新演唱会时间和地点”。

2. 查看官方网站或可信的新闻网站的相关信息。

3. 汇总并记录演唱会的时间和地点。

执行阶段：

1. 在搜索引擎上查找“2024年周杰伦最新演唱会时间和地点”。

   - 结果：找到了一些相关的网页链接。

2. 查看官方网站或可信的新闻网站的相关信息。

   - 结果：在周杰伦的官方网站上找到了2024年最新演唱会的时间和地点。

3. 汇总并记录演唱会的时间和地点。

   - 结果：2024年周杰伦最新演唱会将在2024年5月20日于北京举行。

2.2、ReAct机制

ReAct机制是一种将推理（Reasoning）和行动（Action）结合在一起的实现方式，同时还引入了观察（Observation）环节，在每次执行（Action）之后，都会先观察（Observation）当前现状，然后再进行下一步的推理（Reason）。

它强调的是在感知环境变化后，立即做出反应并采取行动，而不是先制定一个详细的计划。

优点：

适应性强，能够快速响应环境变化。更适合动态和不确定性高的环境。

缺点：

由于没有预先规划，可能在复杂任务中效率较低，每一步都在执行：观察、推理、行动。

举例说明ReAct步骤

比如，我要知道2024年周杰伦最新的演唱会是时间和地点是什么，通过ReAct机制，会被拆解成以下步骤：

推理1：用户想知道2024年周杰伦最新的演唱会是时间和地点是什么，需要查找最新的信息。

行动1：调用Google的搜索API进行搜索。

观察1：搜索结束，搜索的结果中出现一些关于《2024年周杰伦最新的演唱会》的网页信息。

推理2：搜索出来的网页较多，大概浏览前6个网页的具体内容。

行动2：点击第一个网页，开始浏览。

观察2：浏览结束，浏览的网页内容提及到了2024年周杰伦最新的演唱会信息。

推理3：针对网页的内容进行，问题的总结。

结果：将最终的答案输出给用户。

3、代码示例

3.1、Plan-and-Executor机制

LangChain框架已经实现了Plan-and-Executor机制，三行代码即可调用：

核心代码：

# 加载计划

planner = load_chat_planner(model)

# 加载执行器

executor = load_agent_executor(model, tools, verbose=True)

# 加载代理

agent = PlanAndExecute(planner=planner, executor=executor, verbose=True)

完整代码：

from langchain_openai import ChatOpenAI

from langchain_experimental.plan_and_execute import (

    PlanAndExecute, load_agent_executor, load_chat_planner

)

from langchain.tools import BaseTool

from langchain_experimental.tools import PythonREPLTool

model = ChatOpenAI(

    model="gpt-3.5-turbo",

    openai_api_key="sk-xxxxxx",

    openai_api_base="https://api.xiaoai.plus/v1",

)

# 定义工具

class SumNumberTool(BaseTool):

    name = "数字相加计算工具"

    description = "当你被要求计算2个数字相加时，使用此工具"

    def _run(self, a, b):

        return a["title"] + b["title"]

# 加入到工具合集

tools = [SumNumberTool()]

# 加载计划

planner = load_chat_planner(model)

# 加载执行器

executor = load_agent_executor(model, tools, verbose=True)

# 加载代理

agent = PlanAndExecute(planner=planner, executor=executor, verbose=True)

agent.run("你帮我算下 3.941592623412424 + 4.3434532535353的结果")

执行过程：

执行过程见下图，从过程中，我们可以看出，Agent确实是先规划了N个steps，然后一步步执行step。

3.2、ReAct机制

LangChain框架已经实现了ReAct机制，两行代码即可调用：

核心代码：

# 使用reAct的提示词

prompt = hub.pull("hwchase17/structured-chat-agent")

# 创建Agent

agent = create_structured_chat_agent(llm=model, tools=tools, prompt=prompt)

完整代码：

from langchain import hub

from langchain.agents import create_structured_chat_agent, AgentExecutor, tool

from langchain.memory import ConversationBufferMemory

from langchain.schema import HumanMessage

from langchain.tools import BaseTool

from langchain_openai import ChatOpenAI

model = ChatOpenAI(

    model="gpt-3.5-turbo",

    openai_api_key="sk-xxxxxx",

    openai_api_base="https://api.xiaoai.plus/v1",

)

# 定义工具

class SumNumberTool(BaseTool):

    name = "数字相加计算工具"

    description = "当你被要求计算2个数字相加时，使用此工具"

    def _run(self, a, b):

        return a["title"] + b["title"]

# 加入到工具合集

tools = [SumNumberTool()]

# 使用reAct的提示词

prompt = hub.pull("hwchase17/structured-chat-agent")

# 创建Agent

agent = create_structured_chat_agent(llm=model, tools=tools, prompt=prompt)

# 创建记忆组件

memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# 创建Agent执行器

agent_executor = AgentExecutor.from_agent_and_tools(

    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True

)

agent_executor.invoke({"input": "你帮我算下 3.941592623412424 + 4.3434532535353的结果"})

执行过程：

ReAct机制的执行过程，读者自行尝试。与Plan-and-Executor相比，ReAct机制少了规划steps这个环节。

4、完结

本篇主要聊了思维链、AI Agent场景下思维链的2种实现机制、代码示例，具体选择取决于应用场景和问题的复杂性。希望对你有帮助！

本篇完结！欢迎关注、加微信(yclxiao)交流、全网可搜(程序员半支烟)

原文链接：https://mp.weixin.qq.com/s/MTh0x9RYwnLNvaV_U1jOcQ

最近推出了知识星球《开发者AI加持》，一个AI应用开发专栏，旨在助力开发者在这个艰难和变革的时代多一技傍身。还有1V1技术咨询，扫清职业发展和技术道路上的障碍。早鸟价9元，加微信(yclxiao)咨询。