关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。
AI智能体是一种能够通过观察世界并利用其工具实现目标的应用程序。它们具有自主性,能够在没有人类干预的情况下独立行动,尤其是在被赋予明确目标时。与传统的人工智能模型不同,AI智能体不仅依赖于其训练数据,还能通过工具与外部世界互动,获取实时信息并执行实际操作。
AI智能体的核心架构由三个关键部分组成:模型、工具和编排层。
模型是AI智能体的“大脑”,通常是基于语言模型构建的,能够进行推理和逻辑处理。这些模型可以是通用的、多模态的,甚至可以根据特定需求进行微调。为了实现最佳效果,模型应与计划使用的工具和数据签名相匹配。
工具是AI智能体与外部世界互动的桥梁。它们可以是API调用、数据库查询或其他形式的外部服务。工具使AI智能体能够获取实时信息,例如天气数据或客户信息,从而支持更复杂的任务。
编排层是AI智能体的“指挥中心”,负责管理信息输入、推理和决策过程。它通过循环的方式不断调整智能体的行为,直到达到目标或停止条件。编排层的复杂性因任务而异,可能涉及简单的计算或复杂的逻辑链。
AI智能体与传统的人工智能模型有显著区别。传统模型的知识仅限于其训练数据,而AI智能体可以通过工具获取外部信息。AI智能体能够管理会话历史,支持多轮推理和决策,而传统模型通常只能进行单次推理。AI智能体还具备原生的工具实现和逻辑层,能够更有效地执行任务。
AI智能体通过工具与外部世界互动,这些工具可以分为扩展(Extensions)、函数(Functions)和数据存储(Data Stores)。
扩展是连接AI智能体和外部API的标准化方式。它们通过示例教智能体如何使用API端点,并提供必要的参数。
函数类似于软件工程中的代码模块,由智能体调用并执行。与扩展不同,函数在客户端执行,不直接与外部API交互。这种设计为开发者提供了更大的灵活性,尤其是在安全性或认证限制的情况下。
数据存储为AI智能体提供了访问动态和实时信息的能力。通过将数据存储为向量嵌入,智能体可以在运行时检索所需的信息。
AI智能体的认知架构基于推理框架,如ReAct、链式思考(Chain-of-Thought)和树形思考(Tree-of-Thoughts)。这些框架帮助智能体进行信息处理、决策和行动调整。例如,ReAct框架通过提供推理和行动的步骤,使智能体能够更有效地处理用户查询。