跳转到内容

Agent 编排八股:AI PM 面试必会的 5 个 agent 术语

📍 AI 求职速查 4/6 · 上一篇:← RAG 八股

机器人站在控制中心,周围漂浮的面板上有不同工具图标

2025-2026 年 AI PM 面试 agent 是必考。开场最爱问:

简单讲一下你怎么 build 一个 AI Agent?

升级:

ReAct 和 Plan-and-Execute 啥时候用哪个?"
"你做过 Multi-Agent 吗?怎么协调?"
"Subagent 是啥?你见过生产环境用过吗?

这一篇把 5 个 agent 核心术语讲清楚 —— 重点是啥时候选哪个架构(面试官最爱听的就是判断口径)。

💡 想深入看 agent 原理实战的,推荐配合看 Agent 通用知识板块 —— 这一篇是面试速记,那个板块是完整知识体系。


Agent 跟普通 LLM 调用的本质差别:

普通 LLM 调用Agent
一问一答多步自主行动
你给 prompt 它给 text你给目标它自己拆任务 + 调工具 + 反思
输入输出固定过程长度不定(可能 1 步可能 50 步)
没记忆跨步骤 / 跨会话有记忆

关键认知:Agent 不是”LLM 升级版”,是用 LLM 当大脑的自主系统


是啥:接收任务 → 自主规划 → 调用工具 → 反思 → 输出结果的 LLM 驱动系统。不是单次对话,是多步自主行动

核心 5 能力:

能力干啥
1. 任务理解把用户目标拆成子任务
2. 规划决定子任务的顺序 + 调哪个工具
3. 工具调用(Tool Use)调外部 API / 函数
4. 记忆跨步骤 / 跨会话记上下文
5. 反思(Reflection)看自己输出对不对,错了重试

直观例子(订机票):

用户: "帮我订周五飞北京最便宜的票"
Agent 内部:
1. 调航班 API 拿候选(任务理解 + 工具调用)
2. 按价格排序(规划)
3. 调用户 calendar 验证空闲时间(工具调用)
4. 调付款 API 下单(工具调用)
5. 写确认信给用户(任务完成)

普通 LLM 干不了这事 —— 它只能给你”教程文本”,不能真的去订。Agent 能。

面试怎么答(总览题):

“Agent 不是单次对话,是多步自主行动。我看一个东西是不是 agent,核心看 5 件事:能不能拆任务 / 能不能规划 / 能不能调工具 / 能不能记上下文 / 能不能反思。少一个都只能算”半个 agent”。“


二、ReAct(Reasoning + Acting,推理与行动)

Section titled “二、ReAct(Reasoning + Acting,推理与行动)”

是啥:Agent 最经典的模式。每一步让模型输出 Thought(思考)+ Action(行动),执行行动后看 Observation(观察),然后再 reason 下一步。

三个节点连成循环 → 行动扳手 → 观察眼睛 → 回到思考

模板:

Thought: 我需要先查用户 calendar 看周五什么时间空
Action: calendar_check("Friday")
Observation: 周五 9-12 空, 14-18 空
Thought: 早上 9 点航班比较合理
Action: flight_search("Friday morning", "BJ")
Observation: ...

优势:显式推理过程 → 调试容易 + 减少幻觉。

啥时候用:

  • 任务动态 / 不可预知(不知道下一步要干啥,得看上一步结果)
  • 任务步骤不太多(< 10 步)
  • 需要人能看见思考过程(调试期 / 合规期)

啥时候别用:

  • 任务步骤清晰可一次性规划(用 Plan-and-Execute 更稳)
  • 任务几十上百步(ReAct 会被中间错误累积带歪)

面试怎么答:

“ReAct 适合动态任务 —— 每一步根据上一步结果决定下一步。但步骤多了容易累积错误,所以我会按任务复杂度选 —— 单步用函数调用,5-10 步用 ReAct,几十步上 Plan-Execute,跨多角色用 Multi-Agent。”

💡 想深入 ReAct 的设计细节,看 AI agent 是怎么思考的:ReAct 模式 那一篇。


三、Plan-and-Execute(先规划后执行)

Section titled “三、Plan-and-Execute(先规划后执行)”

是啥:Agent 第二种模式。一次性规划整个任务流(规划 agent),再一步步执行(执行 agent)。规划跟执行分离

左边规划白板列着步骤,右边机器人按步骤执行打勾

ReAct vs Plan-and-Execute:

模式决策时机适合
ReAct每步现场决定下一步动态 / 未知任务
Plan-and-Execute一开始全局规划,再执行任务边界清晰 / 步骤多

啥时候用:

  • 任务目标明确 + 步骤可枚举(写一篇文章 / 调研一个产品 / 跑一个固定流程)
  • 每步成本高(不能边跑边猜)
  • 需要给用户预览整个计划(用户先批准再执行)

直观例子(自动写报告):

  • 不用 Plan-Execute:每写完一段决定下一段,容易跑题
  • 用 Plan-Execute:先 plan 章节大纲(“引言 / 现状 / 问题 / 方案 / 结论”),再一章一章写,结构稳

面试怎么答:

“Plan-and-Execute 适合任务结构清晰但步骤多的场景。比如自动写 6 章节研究报告,先规划章节顺序 + 每章要点,再一章一章写 —— 比 ReAct 边写边决定下一段稳定 10 倍。关键判断:用户能不能在执行前预览整个 plan,如果能,Plan-Execute 体验更好(给用户掌控感)。“


四、Multi-Agent 编排(Multi-Agent Orchestration)

Section titled “四、Multi-Agent 编排(Multi-Agent Orchestration)”

是啥:多个专精 agent 协作完成复杂任务。每个 agent 有自己角色 / 工具 / 上下文。

中心戴皇冠的主 agent 派任务卡给三个小工人 agent

3 种主流编排架构:

架构谁分活适合
Hierarchical(主从)1 个总调度 + N 个专精 agent99% 企业场景(有”老板”)
Peer-to-peer(对等)agent 之间直接 message路由 / 接力链(LangGraph / AutoGen)
Pipeline(流水线)A 输出 = B 输入内容创作 / 业务流程

啥时候用 Multi-Agent:

  • 任务能拆开 + 不同子任务需要不同专精(数据 / 文案 / 设计 / 测试)
  • 单 agent 上下文撑不下(任务太复杂)
  • 业务流程本来就分多角色(企业内部审批 / 客服路由)

啥时候别用:

  • 任务能用单 agent 解决 —— 多 agent 增加复杂度 + 成本(LLM 调用 × N)+ 调试地狱
  • agent 之间的协作设计没想清楚 —— 上来就 multi-agent 容易死锁 / 死循环

面试怎么答:

“Multi-Agent 不是越多越好。我的判断口径是先单 agent 跑通,撑不下了再拆。拆的时候先看任务边界 —— 数据 / 文案 / 测试这种真分得开才拆,强耦合的任务别拆(拆了协调成本超过收益)。架构选 Hierarchical 最稳(总调度好调试),Peer-to-peer 适合 well-defined 路由场景。”

💡 想看 5 种 multi-agent 编排模式 + 真实案例 → 多 agent 编排:谁分谁干活 那一篇。


最直观的类比:主管派实习生

主管(主 agent)接到大任务”审整个项目 + 写部署计划”,但他不想自己翻 100 个文件(累 + 占用主管的脑子)。怎么办?

派 3 个实习生分头干:1 号去搜代码,2 号去看测试结果,3 号去看部署历史。每个实习生只把摘要报回给主管,原始日志主管不用看。最后主管基于摘要写计划。

是啥:Anthropic Claude Code 里特有的概念。主 agent 可以临时派一个 subagent 处理子任务,subagent 跑完把结果给主 agent。

主 agent 在上方,三个 subagent 分布下方各自做事

Subagent vs Multi-Agent:

维度Multi-AgentSubagent
关系多个 agent 同级别持续协作主 agent 临时派出 sub,跑完销毁
上下文各自维持上下文主上下文 + sub 短期上下文
生命周期长期运行一次性
典型用法业务流程 / 客服保护主上下文(让 sub 干脏活)

最常见用法:

主 agent 收到:“帮我审整个仓库 + 写部署计划”

  • 主 agent 不去亲自 read 整个 repo(那会撑爆它的上下文)
  • 而是派一个 Explore subagent 去搜代码,只返回摘要给主
  • 再派一个 Plan subagent 写计划
  • 主 agent 综合两个 sub 的返回,输出最终答案

核心价值:保护主上下文不被脏数据污染 + 可以并行多个 sub(并行执行 5 个 subagent 比串行做 5 次快 3-5 倍)。

面试怎么答:

“Subagent 是 Anthropic Claude Code 提的概念,生产环境用过的人少。核心价值是保护主上下文不被脏数据污染 —— 比如让 sub 去读 100 个文件,只返回摘要给主,主不用看原始日志。也能并行(派 5 个 sub 同时跑不同任务)。如果面试官来自字节 / Anthropic 系的 agent 团队(ArkClaw / OpenClaw 等),提一句 subagent 立刻显示你跟上了业界节奏。”

💡 想看 subagent 实战玩法 → Subagents(子智能体) 那一篇。


任务复杂度递进记:

复杂度适合架构
单次问答函数调用 / Tool Use
5-10 步动态任务ReAct
步骤明确的长流程Plan-and-Execute
跨角色协作Multi-Agent
上下文保护 / 并行子任务Subagent

关键认知:这 5 个不是非此即彼,经常组合使用 —— 比如一个 Multi-Agent 系统里某个 agent 内部用 ReAct,某个 agent 派 Subagent。


  • 能讲权衡(trade-off) > 能讲是啥(ReAct vs Plan-Execute 各自代价)
  • 能讲选型口径 > 能讲所有架构(任务多复杂选哪个)
  • 能讲为啥不上 multi-agent > 一上来就吹 multi-agent(显示成熟度)
  • 能讲生产环境失败案例 > 完美故事(讲一次 multi-agent 死循环怎么调试)
  • 能讲跨工具兼容 > 单点架构(LangGraph / Claude Agent SDK / CrewAI 大致区别)

评论

不记名、不需要注册——不要邮箱,不要手机号,不要任何身份信息,填个昵称就能留言。放心说。

  • 加载中 …