Skip to content

Codex / Agent 的整体体系

youxiaohanpian
Published date:

直觉版 → 技术本质 → Codex / Agent 的整体体系:


一、一句话直觉版

类比一下:


二、MCP 是什么(重点讲清楚)

1. MCP 解决的核心问题

在没有 MCP 之前,Agent 想要用外部能力会很乱:

“我给你一个标准协议,你按这个协议暴露能力; 模型按协议使用能力,而不是随便乱接。”


2. MCP 到底是什么

从本质上说,MCP 是一个 “模型 ↔ 外部能力” 的协议层 ,定义了:

MCP 不是一个模型 ,也不是一个 Agent

它是 让模型“可控地扩展能力”的标准方式


3. MCP 通常连接什么

通过 MCP,可以把这些东西“接进来”:


4. 为什么 MCP 对 Agent 很关键

Agent 的核心不是“会说话”,而是:

没有 MCP,Agent 很难进企业、进生产环境。


三、Agent Skills 是什么

1. Agent Skills 不是“模型能力”

这是一个很容易混的点。

“在某个边界内,我可以做一类动作”


2. Skill 通常长什么样

一个 Skill 一般包含:


3. Skills 和 MCP 的关系

这是重点:


四、放到 Codex / Agent 体系里看

把三者放在一起看会非常清楚:

          你(自然语言任务)

        Codex / Agent(推理 + 规划)

           Agent Skills(能做什么)

           MCP(怎么安全调用)

        外部世界(代码 / 系统 / 数据)

举个真实场景:

你说:

“给这个项目加一个缓存层,并保证测试通过”

Agent 内部会做的事:

  1. 用模型能力理解任务

  2. 制定计划(先看代码 → 加逻辑 → 跑测试)

  3. 调用 Skill:

    • read_repo
    • edit_file
    • run_tests
  4. 每个 Skill 背后,都是通过 MCP 调用真实系统

  5. 根据结果继续迭代或收敛


五、为什么最近这两个词一起火

因为行业正在从:


六、一句话总结

七、企业内部 Agent 架构图+拆解线路

1) 企业内部 Agent 架构图(方案/路线图友好)

1.1 总览(从需求到执行)

业务用户 / 工程师 / PM

↓(自然语言需求、约束、验收标准)

Agent 入口层(Chat UI / Slack Bot / IDE 插件 / 工单入口)

Agent Orchestrator(编排与治理)


1.2 分层职责(写方案最常用)


2) 真实企业开发场景拆解(MCP + Skills → 具体组件)

我用一个非常典型、且能覆盖“读/改/测/发/查”的场景:

“线上接口延迟升高 + 需要快速修复并走 PR 流程”

2.1 场景输入(用户给 Agent 的一句话)

“支付服务 POST /charge 延迟从 80ms 升到 300ms。

请定位原因,给出修复 PR,确保单测通过,并提供回滚方案。”

这句话里其实包含了:


2.2 你会实现哪些 Skills(行为层)

把“能干的活”拆成清晰技能(可治理、可审计):

A. 观察/诊断类 Skills(只读)

B. 代码类 Skills(读/写受控)

Skills 的设计重点不在“功能多”,而在:


2.3 MCP 负责把“工具系统”标准接进来(连接器层)

每个 Skill 背后可能需要不同系统支持,而 MCP 做统一接口层:

重点:

MCP 让这些连接器 都长得像“同一种工具”


2.4 完整执行流程(一步一步,落地可照抄)

  1. 任务理解与计划(Orchestrator)
  1. 只读诊断(调用 Skills)
  1. 提出可验证假设(模型推理,但必须“可验证”) 例:
  1. 定位到代码点(代码类 Skills)
  1. 受控修改(写操作)
  1. 验证(执行环境)
  1. 交付(PR 流程)
  1. 回滚与风险(必须产出)
  1. 闭环(可观测)

3) 写路线图时的“建设清单”

把这套东西变成一份落地计划,最常见拆法是三期:

Previous
Design Ops Agent(设计运营/助理)
Next
开始任何任务前的大纲框架选型建议