1. 什么是Agent #
Agent 就是能像 “人” 一样自主完成任务的 AI 程序:你只需要告诉它 “要做什么(目标)”,不用告诉它**“怎么做(步骤)”**,它会自己规划步骤、调用工具、解决问题、完成目标,甚至中途遇到问题会自主调整策略。
| 维度 | 普通大模型(如 ChatGPT) | RAG | AI Agent |
|---|---|---|---|
| 核心能力 | 理解 + 生成文本,无自主规划 / 工具调用 | 大模型 + 知识库检索,补全知识 | 规划 + 工具 + 记忆 + 执行,自主完成任务 |
| 交互方式 | 被动响应单步指令 | 被动响应问答需求 | 主动承接整体目标 |
| 任务处理 | 单步、简单、无依赖的任务 | 知识类问答任务 | 多步、复杂、有依赖的复合任务 |
| 你需要做的事 | 拆解步骤,一步步指挥 | 准备知识库,提精准问题 | 只给目标,无需拆解步骤 |
| 核心定位 | 「AI 聊天助手」 | 「AI 知识问答助手」 | 「AI 工作伙伴 / 执行者」 |
Agent可以大致分为Workflow Agent 与 ReAct Agent 两种。
2. WorkFlow Agent #
WorkFlow Agent 即工作流Agent,是Agent 与业务工作流的结合体,核心是让 AI 智能体自主接管企业标准化、流程化的业务工作流,从 “人按步骤执行工作流” 升级为 “AI Agent 自主规划、执行、监控、闭环整个工作流”。为什么需要工作流Agent?
- LLM 会有幻觉
- LLM 只会说,不会做
- LLM 规划的步骤不靠谱
有些任务就是需要极强的准确度、可控性的,WorkFlow Agent 就成了首选。

如上用coze平台搭建的一个根据用户提供的位置获取位置附近的站点的工作流,其中工作流程有:
- 用户输入地址
- 调用百度地图插件,将地址转换成字符串类型经纬度坐标
- 利用大模型编写Python代码,将字符串经纬度转换成整型的经度及纬度
- 将经纬度与所有的站点位置信息匹配
- 返回离用户输入地址最近的站点
WorkFlow Agent虽然强大,但他比较适合那种流程有规可循、执行可自动化、异常可预判处理的任务,而不适合无固定流程、高度依赖人工主观决策、一次性非标任务,典型的适合任务有:
- 企业行政类标准化审批流程(流程规则极清晰、步骤固定、重复度极高,仅需简单的智能提醒 / 异常处理,几乎无主观决策)
- 企业财务类标准化结算流程(财务流程规则性极强、数据驱动、需跨系统联动(OA / 财务系统 / 银行接口),重复度高,人工执行易出错,适合 Agent 自主完成跨系统操作和数据校验。)
一句总结,WorkFlow Agent 适合有一定规则性的任务(意味着可以根据规则去制订工作流)。
WorkFlow Agent 全景图如上所示。
3. ReAct Agent #
但是在日常环境中,并不是所有的任务都具有规则性,那么这类的问题又该如何处理呢,例如:
- 我有份文件里记录了上个月最终的业务数据,找找是哪份文件
- 检查一下直播系统,我的直播间学员们说很卡,但是网络测速是正常的
- 听说明天台风,我明天从深圳飞北京,能正常起飞么?
针对这种没有规则性的问题,就要轮到 ReAct Agent 出马了。ReAct是Reasoning + Acting的简写,即让Agent推理、行动、获得反馈,再根据反馈再次推理、行动、获得反馈,直到获得答案为止。
以问题“9 月份销售额不达标的供应商”为例,说明下整个推理、行动、反馈的整体流程。

这种让模型模拟人类逐步推理、分步解决问题的思考过程,而非直接输出答案的模式,就叫思维链模式,是大语言模型领域的核心提示工程技术。但思维链模式并非万能,仅在需要多步推理的场景中发挥价值,例如:
- 数学计算:小学 / 中学数学题、代数 / 几何演算、数据分析计算
- 逻辑推理:演绎推理、归纳推理、逻辑题(如真假话判断、排列组合)
- 常识推理:需要生活 / 领域常识的多步问题(如行程问题、购物找零)
- 简单规划:基础的任务拆解(如「如何在 1 小时内完成早餐 + 通勤)
- 代码调试:简单代码的逻辑分析、错误定位(分步推导代码执行过程)
不适用场景:简单的事实问答(如「北京是中国首都吗?」)、单一指令任务(如「翻译一句话」),此类场景用思维链会增加冗余,降低效率。
4. Agent平台 #
Agent平台即管理、运行、支持一系列 Agent的平台。
- 法律界的AI Agent平台:https://www.harvey.ai/
- 企业级知识库的AI Agent平台:https://www.glean.com/
glean连接企业日常应用
glean构建企业知识图谱

glean利用企业知识库构建企业搜索引擎