Skip to content

Agent (AI Agent)

什么是 Agent

Agent 是能够自主感知环境、做出决策并执行动作的 AI 系统。与传统程序不同,Agent 可以: - 理解复杂目标 - 规划多步行动 - 使用工具 - 适应变化

Agent 的核心组件

1. 规划 (Planning)

  • 目标分解:将大任务拆分为可执行的子任务
  • 反思机制:评估行动效果,调整策略
  • 思维链 (Chain of Thought):展示推理过程

2. 记忆 (Memory)

  • 短期记忆:当前对话上下文
  • 长期记忆:持久化的知识和经验
  • 检索增强:结合 RAG 技术

3. 工具使用 (Tool Use)

  • 调用外部 API
  • 执行代码
  • 读写文件
  • 搜索信息

4. 协作 (Multi-Agent)

  • 多个 Agent 协作完成复杂任务
  • 分工明确,各司其职
  • 通信协议定义交互方式

Agent 类型

类型 描述 示例
单任务 Agent 完成特定简单任务 天气查询 Bot
任务规划 Agent 拆解并执行复杂任务 AutoGPT
对话 Agent 持续对话交互 ChatGPT
工具型 Agent 辅助完成具体工作 代码助手
协作型 Agent 多 Agent 协作 MetaGPT

设计模式

  • ReAct:推理 + 行动交替
  • Plan-and-Execute:先规划后执行
  • Reflexion:自我反思改进
  • Tree of Thoughts:思维树搜索

著名 Agent 框架

  • LangChain / LangGraph
  • AutoGen (Microsoft)
  • CrewAI
  • MetaGPT
  • ChatDev

与 LLM 的区别

维度 LLM Agent
核心能力 文本生成 决策 + 行动
工具使用 被动 主动
自主性
执行链路 单轮/多轮对话 感知→规划→执行→反馈

状态

evergreen

来源

待补充