content-forge-vault/00-inbox/2026-03-24-agent-friendly-glossary.md
2026-03-25 02:00:01 +08:00

38 KiB
Raw Permalink Blame History

id title slug status content_type channels language source_urls assets cover_image template owner created_at updated_at published_at tags
2026-03-24-agent-friendly-glossary Agent Friendly 概念与名词解释词典 agent-friendly-glossary inbox article
wechat
x
zh-CN
https://www.anthropic.com/research/building-effective-agents
https://www.anthropic.com/engineering/writing-tools-for-agents
https://modelcontextprotocol.io/specification/2025-06-18/server/tools
https://agentexperience.ax/
https://llmstxt.org/
https://agents.md/
https://a2a-protocol.org
https://github.com/shareAI-lab/learn-claude-code
article content-forge 2026-03-24T00:00:00+08:00 2026-03-24T00:00:00+08:00 null
agent-friendly
glossary
AX
MCP
A2A
agentic-AI

Agent Friendly 概念与名词解释词典

本词典按主题分组,每个词条包含:定义、核心要点、与其他概念的关系、出处。


一、核心范式

Agent Friendly智能体友好

定义:一种系统设计理念——让 AI Agent 能自主发现、理解、调用、验证你的系统,无需人类在旁翻译或适配。

类比:如同 "Mobile Friendly" 让网站适配手机,"Agent Friendly" 让数字基础设施适配 AI Agent 作为一等公民消费者。

核心层面

  • Agent-Friendly API自描述、Schema-first、可预测响应、类型化错误
  • Agent-Friendly Documentation机器可读文档llms.txt、Markdown-first
  • Agent-Friendly Product程序化认证、即时 onboarding、无 CAPTCHA 墙
  • Agent-Friendly Web内容协商同一 URL 按 user-agent 返回 HTML 或 Markdown/JSON

关系Agent Friendly 是 AX 的实现手段AX 是 Agent Friendly 的学科化表达。


AXAgent Experience智能体体验

定义Agent Experience 的缩写,由 Netlify CEO Matt Biilmann 于 2025 年初命名。指为 AI Agent 设计产品、API、文档的用户体验学科与 UX用户体验和 DX开发者体验平行。

演进链

UX (User Experience, 1993, Don Norman)
  → DX (Developer Experience, 2011, Jeremiah Lee Cohick)
    → AX (Agent Experience, 2025, Matt Biilmann)

三个核心维度

  • Context上下文Agent 能否理解你的站点/API 做什么?
  • Access访问Agent 能否通过程序化方式认证和操作?
  • Navigation导航Agent 能否通过机器可读路径在产品中导航?

关键洞察AX 改善 DX而非替代 DX。让 API 对 Agent 更友好的改进,同时让人类开发者受益。

出处agentexperience.axMatt Biilmann - Introducing AX


ACIAgent-Computer Interface智能体-计算机接口)

定义Anthropic 提出的概念,指 Agent 与外部工具/系统交互的界面设计。类比 HCIHuman-Computer Interface强调 Agent 的工具接口设计需要与人类界面设计同等的投入和迭代。

核心原则

  • 投入与 HCI 同等精力设计 ACI
  • 从模型视角思考:"仅凭工具名和描述,是否显而易见该如何使用?如果不是,模型也会困惑。"
  • 好的工具定义 = 给一个靠谱但字面理解一切的初级工程师写文档
  • 用 Claude 自身协作改进工具定义,比人工创建效果更好

关系ACI 是 AX 在工具层的具体实现方法论。

出处Anthropic - Building Effective Agents


LLMOLarge Language Model Optimization大语言模型优化

定义:针对 AI 大语言模型(而非搜索引擎)优化内容的实践。目标是让你的内容被 LLM 正确理解、引用和推荐,类似于 SEO 针对 Google 的优化。

也称为GEOGenerative Engine Optimization、AIOAI Optimization、Agent SEO

关键区别

维度 传统 SEO LLMO
优化对象 Google 爬虫 LLM / AI Agent
核心手段 关键词、反向链接 结构化数据 (JSON-LD)、llms.txt
成功指标 SERP 排名、CTR AI Overview 引用率、Agent 调用率
内容格式 HTML Markdown、JSON Schema

数据58.5% Google 搜索已零点击AI Overview 出现时有机 CTR 下降 61%+。


二、协议与标准

MCPModel Context Protocol模型上下文协议

定义:由 Anthropic 于 2024 年 11 月创建的开放协议,标准化 AI Agent 与工具/数据源的连接方式。2025 年 12 月捐赠给 Linux Foundation AAIF。

架构:客户端-服务器模型,基于 JSON-RPC 2.0(受 LSP 启发)。

三个原语

  • Tools(工具):模型控制的可调用函数,如 search_documentscreate_issue
  • Resources(资源):应用控制的数据源,如文件、数据库记录
  • Prompts(提示):用户控制的预定义提示模板

采纳规模10,000+ 已发布 MCP Server97M+ 月 SDK 下载Claude、ChatGPT、Cursor、Gemini、VS Code、Copilot 均支持。

定位垂直连接——Agent 到 Tool/Data 的标准通道。

关系:与 A2A 互补MCP 管 Agent→ToolA2A 管 Agent→Agent

出处modelcontextprotocol.io


A2AAgent-to-Agent Protocol智能体间协议

定义Google 于 2025 年 4 月在 Cloud Next 发布的开放协议,标准化不同 Agent 之间的跨平台通信。2025 年 7 月捐赠给 Linux Foundation2026 年 1 月达到 RC 1.0。

架构:基于 HTTP、SSE、JSON-RPC 的客户端-服务器模型,支持 gRPCv0.3+)。

关键概念

  • Agent Card智能体名片JSON 元数据文件,发布在 /.well-known/agent-card.json,描述 Agent 的名称、能力和端点
  • Task(任务):跨 Agent 的工作单元,有可追踪的 ID 和生命周期
  • 支持多模态交互(包括音视频流)

定位水平互操作——Agent 到 Agent 的跨组织通信。

支持者150+ 组织,包括 Salesforce、SAP、PayPal、Atlassian、IBM、Microsoft。

实际应用Tyson Foods 和 Gordon Food Service 用于供应链 Agent 协作。

出处a2a-protocol.org


AAIFAgentic AI Foundation智能体 AI 基金会)

定义2025 年 12 月在 Linux Foundation 下成立的开放治理组织,旨在统一 Agent 生态标准,防止供应商锁定和碎片化。

创始成员Anthropic、OpenAI、Block三方联合创立白金会员AWS、Google、Microsoft、Bloomberg、Cloudflare。

治理的三个创始项目

  • MCPAnthropic 捐赠Agent→Tool 连接
  • AGENTS.mdOpenAI 联合创建):项目级 Agent 指令
  • gooseBlock 捐赠):开源本地优先 Agent 框架

类比:如同 W3C 之于 Web 标准AAIF 之于 Agent 标准。

出处Linux Foundation AAIF 公告


llms.txt

定义:由 Jeremy HowardAnswer.AI 联合创始人)于 2024 年 9 月提出的标准,在网站根目录放置一个 /llms.txt 文件,为 LLM 提供优化的站点摘要。被称为"AI 版 robots.txt"。

格式Markdown 文件包含站点标题H1、结构化分区、链接及一句话描述。

配套文件

  • /llms.txt:轻量摘要 + 链接索引
  • /llms-full.txt:完整文档内容编译为单一 Markdown 文件Mintlify + Anthropic 联合定义)

采纳600+ 网站,包括 Anthropic、Stripe、Perplexity、Cursor、Zapier、Cloudflare、Hugging Face。

关键洞察

  • AI Agent 访问 llms-full.txt 的频率是 llms.txt2 倍以上
  • Stripe 利用 llms.txt 的 instructions section 主动纠正模型漂移
  • 截至 2025 年 8 月,主要 LLM 爬虫GPTBot、ClaudeBot尚未主动读取 llms.txt更多被 MCP/RAG 管道消费

出处llmstxt.org


AGENTS.md

定义:为编码 AI Agent 提供项目级指令的开放标准。纯 Markdown 文件,放置在仓库根目录。

设计哲学:极致简洁——单文件、纯 Markdown、工具无关、人类优先。

采纳60,000+ 开源仓库GitHub Copilot、Codex、Gemini CLI、Cursor、Devin、Factory、Jules、VS Code 均支持。

优先级规则:离编辑文件最近的 AGENTS.md 优先;用户的显式 prompt 覆盖一切。

关系AGENTS.md 是通用标准CLAUDE.md 是 Claude Code 专属的项目指令文件(功能类似但仅 Claude 识别)。

类似物

文件 适用工具
AGENTS.md 所有支持的 AI 编码工具(通用)
CLAUDE.md Claude Code
.cursorrules / .cursor/rules/*.mdc Cursor
.github/copilot-instructions.md GitHub Copilot
.windsurfrules Windsurf

出处agents.md


Agent Card智能体名片

定义A2A 协议中的标准化 JSON 元数据文件,发布在 /.well-known/agent-card.json,描述一个 Agent 的身份、能力、技能和服务端点。

功能:让其他 Agent 能够发现理解你的 Agent 能做什么,类似于 OpenAPI spec 描述 API 能力。

字段示例:名称、描述、能力列表、认证方式、端点 URL。

意义:第一个被 IANA 注册的 AI Agent 专属 .well-known 条目。


Agent Skills智能体技能

定义Anthropic 于 2025 年 12 月提出的标准化可移植程序化知识格式。让 Agent 能够携带和共享结构化的操作知识步骤、约束、NEVER 规则)。

结构SKILL.md 文件包含——精确步骤、边缘情况处理、NEVER 列表、输入/输出规范。

设计三原则Block

  1. Take away from the agent:一致性关键行为写入脚本/模板/规则,不靠 LLM 推理
  2. Let agent reason where it adds value:解释、选择、对话是 Agent 的领地
  3. Constitutional constraintsSKILL.md 是契约——精确步骤 + 边缘情况 + NEVER 规则

出处The New Stack - Agent Skills


ACPAgent Communication Protocol智能体通信协议

定义:由 Cisco、LangChain、Galileo 联合推动的"Agent 互联网"协议。

也称为AGNTCY 项目的核心协议之一。

定位:组织内部 Agent 协调(比 A2A 更偏内部场景)。

状态规范阶段75+ 公司参与。后期 IBM 的 ACP 实现也合并进入 A2A 生态。


ANPAgent Naming Protocol / Agent Network Protocol

定义:去中心化的 Agent 注册和发现协议,基于 DID去中心化标识符实现点对点 Agent 发现。

定位:开放互联网上的 Agent 发现(无中心注册机构)。

类比:如同 DNS 之于域名ANP 之于 Agent 身份。

状态:早期规范阶段。


Agentic Commerce Protocol智能体商务协议

定义Stripe 与 OpenAI 联合开发的开放规范,让 AI 平台能嵌入商务流程(搜索、选品、结账、支付)。

关键机制Shared Payment Tokens (SPTs)——仅需一行代码变更即可实现 Agent 支付。

许可Apache 2.0 开源。

出处Stripe Blog


WebMCP

定义Google 于 2026 年 2 月提出的协议,让 AI Agent 在浏览器中与网站进行结构化交互(而非模拟点击)。

状态Chrome Canary 预览阶段。


A2UIAgent-to-User Interface智能体到用户界面协议

定义Google 开源Apache 2.0)的协议,让 Agent 能跨信任边界发送富 UI 组件。Agent 发送声明式组件描述,客户端用原生 widget 渲染。

解决问题Agent 需要产生可视化输出,但直接执行渲染代码有安全风险。

出处a2ui.org


x402

定义:复活 HTTP 402 "Payment Required" 状态码的协议,用于 Agent 到 API 的实时微支付。

场景Agent 调用付费 API 时API 返回 402 + 支付指令Agent 自动完成支付后重试请求。


三、工具与 Schema 概念

Tool工具

定义MCP 语境)MCP 服务器暴露的可调用函数,由模型控制调用。每个 Tool 有 name、description、inputSchema可选 outputSchema 和 annotations。

设计核心:一个 Tool = 一个用户目标 = 一个风险级别。

与 Function Calling 的关系Tool 是 MCP 协议内的术语Function Calling 是 OpenAI/Anthropic API 层的术语。本质相同——让 LLM 调用外部函数。


Function Calling函数调用

定义LLM API 提供的能力,让模型在对话中识别何时需要调用外部函数,并生成结构化的函数调用参数。

工作流

用户提问 → LLM 判断需要调用函数 → 生成 {name, arguments} JSON
→ 客户端执行函数 → 结果返回 LLM → LLM 整合回答

提供商OpenAIfunction_call / tool_choice、Anthropictool_use、Googlefunction_calling


inputSchema / outputSchema

定义MCPTool 的输入和输出数据结构定义,遵循 JSON Schema 规范。

inputSchema 规则

  • 必须是 "type": "object" 的 JSON Schema
  • 扁平化(顶层原语,禁止 3 层+嵌套)
  • 所有字段列入 required可选字段用 ["string", "null"]
  • additionalProperties: false
  • 有限值域用 enum

outputSchema 规则MCP spec 2025-06-18+

  • 返回 structuredContent(类型化 JSON+ TextContent(向后兼容文本)
  • 只返回高信号字段,非全量数据

Tool Annotations工具注解

定义MCP spec 2025-03-26+:附加在 Tool 上的元数据提示,帮助客户端做 UI/安全决策。

注解 含义 默认值
readOnlyHint 不修改环境(读操作) false
destructiveHint 可能破坏数据(删除操作) true
idempotentHint 重复调用结果相同 false
openWorldHint 与外部实体交互 true

关键警告:注解是提示hints不是安全保证。客户端不得仅基于注解做安全关键决策。


OpenAPI / Swagger

定义:描述 RESTful API 的标准规范(当前版本 3.1)。定义端点、参数、请求/响应 Schema、认证方式等。

与 Agent 的关系OpenAPI spec 是 Agent 理解 API 的基础"地图"。Agent 通过解析 OpenAPI spec 来选择端点、构造请求、解析响应。

Agent 要求

  • 每个操作必须有 operationIdCritical
  • 每个操作必须有 summary + description
  • 参数必须有 type + description + format
  • 错误响应必须有 Schema 定义

JSON Schema

定义:描述 JSON 数据结构的标准(当前 Draft 2020-12。定义字段类型、约束、必填性、枚举值等。

在 Agent 生态中的角色

  • MCP Tool 的 inputSchema/outputSchema 基于 JSON Schema
  • OpenAI Function Calling 的参数定义基于 JSON Schema
  • Agent 通过 JSON Schema 验证输入/输出,减少幻觉

JSON-LDJSON for Linking Data

定义:在 JSON 中嵌入语义化链接数据的 W3C 标准。用 @context@type 将 JSON 数据连接到 Schema.org 等词汇表。

与 Agent 的关系

  • Google2025 年 5 月)官方推荐 JSON-LD 作为 AI 优化内容的格式
  • SearchVIU 测试确认 ChatGPT、Claude、Perplexity、Gemini 均处理 JSON-LD
  • Agent 通过 JSON-LD 理解实体关系(作者、发布者、日期、权威性信号)

常用 Schema 类型FAQPage、HowTo、Product、Review、Article、Organization。


Schema.org

定义Google、Microsoft、Yahoo、Yandex 联合创建的结构化数据词汇表。为网页内容提供标准化的语义标注。

与 Agent 的关系Schema.org 标记让 Agent 能理解网页中实体的类型和关系,而非仅解析文本。


Arazzo

定义OpenAPI Initiative 推出的标准,定义 API 操作的序列workflow。不同于 OpenAPI 描述单个端点Arazzo 描述多个端点如何组合成完整工作流。

与 Agent 的关系Agent 执行多步任务时Arazzo 提供"路线图"——先调什么、再调什么、用什么条件分支。


HATEOASHypermedia as the Engine of Application State

定义REST 架构约束,要求 API 响应中包含导航链接,告诉客户端下一步可以做什么。

与 Agent 的关系HATEOAS 式响应减少 Agent 幻觉——不需要猜测下一步该调什么接口,响应本身就告诉它。

示例

{
  "order_id": "12345",
  "status": "pending",
  "_links": {
    "cancel": "/orders/12345/cancel",
    "pay": "/orders/12345/pay"
  }
}

四、安全概念

Least Privilege最小权限

定义:只授予完成任务所需的最小权限集合。安全基础原则。

在 Agent 语境中Agent 只获得当前任务需要的工具、数据和操作权限。


Least Agency最小代理权

定义:比 Least Privilege 更进一步的约束。不仅限制"能访问什么",还限制"能做什么动作"和"做多少次"。

为什么需要:一个拥有 email:send 权限的 Agent 技术上可以给通讯录每个人发邮件。Least Privilege 允许这么做有权限Least Agency 不允许(超出代理范围)。

实现通过集中化策略引擎OPA/Cedar/Oso在每次特权操作时检查。

出处OWASP LLM06 (Excessive Agency)


KYAKnow Your Agent了解你的智能体

定义:类比金融领域的 KYCKnow Your CustomerKYA 是识别和验证 AI Agent 身份的框架。

三个问题

  1. Who is this agent?(身份)
  2. Who controls it?(权限方)
  3. Can it be trusted?(信誉)

实现密码学签名、数字证书、Agent 身份注册。

行业动态78% 金融机构预计 AI 购物 Agent 将带来欺诈风险上升。

出处SumsubAgentFacts KYA Standard


Prompt Injection提示注入

定义:通过精心构造的输入文本,覆盖或绕过 LLM 的系统指令使其执行非预期行为。Agent 安全的头号威胁。

两种形式

  • 直接注入:用户输入中包含 "ignore previous instructions"
  • 间接注入Agent 检索的外部数据(网页、邮件、文档)中嵌入恶意指令

防御原则Prompt 不是安全边界。危险能力通过策略/allowlist 移除,而非通过 prompt 禁止。


Tool Poisoning工具投毒

定义:攻击者通过操纵 MCP Tool 的元数据name、description、parameter schema或输出内容引导 LLM 执行恶意操作。

攻击方式

  • 在工具描述中嵌入隐藏 prompt 指令
  • 在工具返回值中注入影响后续推理的内容
  • 修改工具定义后重新部署rug pull

防御MCP 网关层扫描所有工具元数据;版本锁定 + 代码签名。


Schema PoisoningSchema 投毒)

定义:操纵工具的 JSON Schema 字段(如描述、默认值、示例)来影响 LLM 的工具选择和参数生成。


Cascading Hallucination级联幻觉

定义:多 Agent 系统中,一个 Agent 的幻觉输出被下游 Agent 当作事实处理,在链路中逐级放大。

示例Agent A 幻觉出一个不存在的 SKU → Agent B 查询价格 → Agent C 检查库存 → Agent D 生成订单——全部基于虚假数据。

防御:每个 Agent 独立验证输入;不信任上游 Agent 的输出。


Memory Poisoning记忆投毒

定义:污染 Agent 的共享记忆/上下文存储,影响所有后续决策。

数据Galileo AI 研究显示,初始记忆投毒后 4 小时内 87% 的下游决策受到影响。

防御:共享上下文使用不可变存储 + 密码学验证。


Slopsquatting

定义:利用 LLM 幻觉出不存在的软件包名这一特性,在 npm/PyPI 等包管理平台注册这些虚假包名,嵌入恶意代码。

数据:一项 2.23M 样本研究发现 LLM 幻觉包名的比率高达 19.7%。

防御:所有依赖锁定版本 + hash 校验。


MPMAMCP Preference Manipulation AttackMCP 偏好操纵攻击)

定义:攻击者改变 Agent 排序和选择工具的方式,使其优先使用恶意工具或绕过安全工具。

防御:建立工具选择行为基线,监控偏离。


Circuit Breaker熔断器

定义:借鉴电路熔断的软件设计模式。当连续失败达到阈值时自动"断开"(停止调用),周期性探测恢复。

在 Agent 中的应用:防止 Agent 在工具失败时陷入无限重试循环。N 次连续失败后自动熔断,避免资源浪费。


HITLHuman-in-the-Loop人在环路中

定义:在 Agent 自动执行流程中保留人类审批/确认节点。对于不可逆或高影响操作是强制要求。

MCP 规范原文"For trust & safety and security, there SHOULD always be a human in the loop with the ability to deny tool invocations."——业界共识:将 SHOULD 视为 MUST。


Dry-run干跑/预演)

定义:执行操作的所有步骤但不产生实际副作用。用于让 Agent或人类在提交前预览操作结果。

实现API 提供 ?dry_run=true 参数;返回"如果真正执行会发生什么"的结果。


Intent Preview意图预览

定义:在 Agent 执行多步或破坏性操作前,以人类可读的方式展示计划执行的所有步骤。

包含

  • 每一步的动作摘要
  • 每步的可逆性标记
  • 人类可编辑/取消的能力
  • 永不自动消失

Token Exchange令牌交换RFC 8693

定义OAuth 2.0 扩展,允许将一个高权限 token 交换为一个范围更小、时间更短的 token。

在 Agent 中的应用:人类用户的全权限 token 不直接传给 Agent而是通过 Token Exchange 签发仅限特定任务、特定时间的受限 token。


五、评估框架

Postman 8 Pillars / 48 ChecksPostman 八支柱 / 48 项检查)

定义Postman 开发的 API Agent 就绪度评估框架。对任何 OpenAPI spec 执行 48 项检查,产生 0-100 分。

八个支柱

  1. META元数据operationId、summary、description
  2. ERR错误4xx/5xx 定义、错误 Schema、429 定义
  3. INTRO内省参数类型、required 标记、枚举、示例
  4. NAME命名一致大小写、RESTful 路径、HTTP 语义
  5. PRED(可预测性):响应 Schema、分页、日期格式
  6. DOC文档认证、频率限制、API 概述
  7. PERF(性能):频率限制头、缓存头、批量端点
  8. DISC发现OpenAPI 版本、Server URL、多环境

通过阈值:≥ 70 分且 8 项 Critical 全部通过。

出处Postman AI-Ready APIs


SlowMist MCP Security Checklist慢雾 MCP 安全清单)

定义:慢雾安全团队开发的 MCP 安全检查清单,涵盖 ~90+ 检查项。

六大类MCP Server 安全、MCP Client/Host 安全、LLM 适配安全、多 MCP 场景、加密特定、自评工具。

优先级High必须实现/ Medium强烈推荐/ Low推荐

出处github.com/slowmist/MCP-Security-Checklist


CoSAI MCP Security WhitepaperCoSAI MCP 安全白皮书)

定义Coalition for Secure AI安全 AI 联盟)于 2026 年 1 月发布的 MCP 安全白皮书。识别 12 类威胁、~40 个具体威胁,提出 8 项优先建议。

八项优先建议:端到端 Agent 身份追踪、最小权限、输入消毒(严格 allowlist、所有 LLM/MCP 输出视为不可信、沙箱隔离 MCP Server、传输保护mTLS、敏感操作 HITL、供应链控制代码签名 + 依赖锁定)。

出处CoSAI GitHub


OWASP Top 10 for LLM Applications

定义OWASP 针对 LLM 应用的十大安全风险清单2025 版)。

Agent 相关重点

  • LLM01 Prompt Injection:提示注入
  • LLM06 Excessive Agency:过度代理权(三个根因:过度功能、过度权限、过度自治)
  • LLM10 Unbounded Consumption:无限制资源消耗

扩展2025 年 12 月另发布了 OWASP Top 10 for Agentic Applications(专门针对 Agent 系统)。


Google Cloud 三支柱评估

定义Google Cloud 提出的 Agent 系统评估方法论。

支柱 测试类型 测什么
最终输出 集成测试 任务完成率、正确性、事实基础
决策过程 单元测试 工具选择准确率、推理逻辑
韧性 压力测试 优雅降级、错误恢复、对抗鲁棒性

评分A / B / C / F


复合精度公式

定义:多步 Agent 工作流的端到端成功率计算公式。

端到端成功率 = (单步准确率) ^ 步骤数

含义95% 单步准确率的 Agent 在 10 步工作流中只有 60% 成功率。每一个工具设计决策都在影响单步准确率;更少的步骤 = 指数级更高的可靠性。


六、设计概念

Schema-FirstSchema 优先)

定义先定义数据契约Schema再实现业务逻辑。Schema 同时充当文档、验证规则和测试基准。

在 Agent 语境中Agent 通过 Schema 理解如何调用你的系统。没有 Schema = Agent 只能猜测。

关系:与 content-forge 的 "Frontmatter-First" 原则同构。


Content Negotiation内容协商

定义HTTP 机制,客户端通过 Accept header 告知服务器期望的响应格式,服务器返回对应格式。

Agent Friendly 应用

  • 浏览器请求 → 返回 HTML人类可读
  • Agent 请求 → 返回 Markdown 或 JSON机器可读
  • 通过 User-Agent 或 Accept header 区分

Idempotency幂等性

定义:同一操作执行多次,结果与执行一次相同。

为什么对 Agent 关键Agent 在不确定时会重试。网络可能中断。没有幂等性,重试会导致重复状态变更(重复创建订单、重复发送邮件)。

示例

  • 幂等:DELETE /file/123(删除已删除的文件是无操作)
  • 非幂等:POST /send-email(每次调用都发一封新邮件)

实现:客户端生成 Idempotency Key服务端去重。


Progressive Autonomy渐进式自治

定义Agent 从最低权限/最多人工确认开始,随着用户建立信任,逐步增加自动化程度。

原则:每个动作默认可逆;高风险操作永远需要确认。


Graceful Degradation优雅降级

定义:当工具/服务不可用或 Agent 遇到错误时,系统有序地降低功能级别(而非崩溃或幻觉)。

Agent 应用

  • 预算耗尽 → 降级到更便宜的模型
  • 工具超时 → 返回缓存结果或明确告知失败
  • 外部服务不可用 → 建议替代操作路径

Outcome-Oriented Tool面向结果的工具

定义:工具设计围绕用户最终目标,而非 API 端点的 1:1 映射。

示例

  • 面向端点:get_customer_by_emaillist_customer_ordersget_order_status3 次调用)
  • 面向结果:track_order(email)1 次调用,内部完成 3 步)

Block 经验Linear MCP 从 30+ 工具重建三次,最终缩减到 2 个。


Task-Oriented vs Entity-Oriented

定义:两种工具设计哲学。

  • Entity-Oriented实体导向CRUD 操作映射到数据实体——create_userget_userupdate_userdelete_user
  • Task-Oriented(任务导向):映射到用户实际想完成的任务——onboard_new_employeeschedule_meetingtrack_order

Agent 偏好Task-Oriented 减少链式调用步骤,提高端到端成功率。


七、基础设施概念

MCP Server

定义:实现 MCP 协议的服务端程序,暴露 Tools、Resources、Prompts 供 Agent 使用。

类比:如同 Web Server 服务网页MCP Server 服务 Agent 工具。

运行模式

  • stdio:通过标准输入/输出通信(本地进程)
  • HTTP + SSE:通过 HTTP 通信(远程/云端)

MCP Client / MCP Host

定义

  • MCP ClientAgent 侧的 MCP 协议实现,负责连接 MCP Server、调用工具
  • MCP Host:运行 MCP Client 的应用(如 Claude Desktop、VS Code、Cursor

关系Host 包含 ClientClient 连接 Server。


Agent Gateway智能体网关

定义Agent 与外部工具/API 之间的中间层,集中处理认证、授权、流量控制、安全扫描、审计。

功能

  • MCP 元数据扫描(检测工具投毒)
  • 请求级鉴权(策略引擎集成)
  • 流量限制和预算执行
  • 审计日志集中收集

类比:如同 API Gateway 之于微服务Agent Gateway 之于 Agent 工具调用。


Sandbox / MicroVM

定义:隔离执行环境,限制 Agent/代码的系统访问能力。

隔离级别(从弱到强):

  1. 进程隔离(最弱)
  2. 容器Docker/gVisor——不足以作为安全边界
  3. MicroVMFirecracker/Kata——推荐
  4. 完全虚拟化

Agent 规则:每个 MCP Server 应运行在独立隔离上下文中。合并多个 Server如 Git + Filesystem会创建"有毒组合"。


Policy Engine策略引擎

定义:外部化的授权决策系统,将权限规则从应用代码中解耦。

主流工具

  • OPAOpen Policy Agent通用策略引擎Rego 语言
  • CedarAWS类似 IAM 策略的声明式语言
  • Oso:嵌入式授权引擎

在 Agent 中的角色:每次工具调用时,策略引擎实时判断"这个 Agent 在这个上下文下能否执行这个操作"。


八、Harness Engineering 概念

Harness驾驶舱 / 运行环境)

定义Agent模型运行所需的一切外围代码和基础设施。模型是司机Harness 是车辆。

公式

Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions

核心原则模型决定Harness 执行。模型推理Harness 提供上下文。好的 Harness 代码是"几乎无聊的"——简单循环、清晰工具定义、干净的上下文管理。

来源shareAI-lab/learn-claude-code


Harness Engineering驾驶舱工程

定义:构建 Agent 运行环境的工程学科。与 Agent Friendly被调用方视角互补——Harness Engineering 是构建方视角。

核心工作

  • 实现工具(给 Agent 手)
  • 策划知识(给 Agent 专业领域)
  • 管理上下文(给 Agent 清晰记忆)
  • 控制权限(给 Agent 边界)
  • 采集 Task-Process 数据(给未来模型训练信号)

关键心智转换"我不是在写智能。我是在构建智能栖息的世界。"


Agent Loop智能体循环

定义Agent 运行的核心循环——调用 LLM、检查是否需要工具调用、执行工具、将结果返回 LLM、重复。

最小实现~30 行 Pythonwhile True + stop_reason != "tool_use" 作为退出条件。

设计不变量:所有后续机制(规划、压缩、团队)叠加在循环周围,循环本身从不改变。

Agent-Friendly 关键:模型决定何时停止,代码永不强制决策。


Tool Dispatch Map工具调度映射

定义{tool_name: handler_function} 的字典/映射Harness 通过它将 LLM 的工具调用请求路由到正确的处理函数。

意义:添加新工具 = 添加一个 handler + Schema核心循环无需改变。

关系Dispatch Map 是构建方的概念;对应被调用方的 MCP Tool 定义和 OpenAPI operationId。


Context Compact / Compression上下文压缩

定义:管理 Agent 上下文窗口的三层策略,防止长会话中记忆过载。

三层

  1. 微压缩(每轮):替换旧 tool_result 为占位符
  2. 自动压缩>50K token完整记录存磁盘LLM 生成摘要
  3. 手动压缩:模型主动调用 compact 工具

关键:信息不丢失,只是从活跃上下文移到磁盘。模型可以随时触发手动压缩。

独有领域:这是 Harness Engineering 独有概念Agent Friendly 规约不涉及(规约关注被调用方接口,不管 Agent 内部记忆)。


Subagent子智能体

定义:从主 Agent 分叉出的一次性子 Agent获得空白 messages 上下文,执行完后只返回摘要文本。所有中间消息丢弃。

与 Agent Teams 的区别Subagent 是一次性的执行完即消失Team Agent 是持久化的(跨多轮工作)。

关键约束:子 Agent 不能再生子 Agent禁止递归

对应规约概念§4 安全 / Sandbox 隔离——上下文隔离是一种轻量级沙箱。


Task DAG任务有向无环图

定义:磁盘持久化的任务依赖图。每个任务是一个 JSON 文件,包含 blockedBy/blocks 依赖关系。完成一个任务自动解锁其依赖者。

回答三个问题:什么能做?什么被阻塞?什么已完成?

意义:任务图是所有后续机制(团队、自治)的协调骨架。跨会话持久,不受上下文压缩影响。


Agent Teams智能体团队

定义:多个持久化 Agent 通过 JSONL 邮箱通信,各自运行完整 Agent Loop。每个 Agent 有名字、角色和状态生命周期WORKING↔IDLE↔SHUTDOWN

与 A2A 的关系Team mailbox 是 A2A 协议的简化版——同一进程内的 Agent 间通信,而非跨组织通信。


Autonomous Task Claiming自治任务领取

定义Agent 在 IDLE 状态时自动轮询任务板5 秒间隔),领取未被认领的、未被阻塞的任务。无需领导者分配。

关键机制60 秒空闲无任务 → 自动关闭。身份重注入——上下文压缩后如果消息 ≤ 3 条,自动重新注入 Agent 身份信息。

对应规约概念Agent Card 发现 + 去中心化自组织。


Worktree Isolation工作树隔离

定义:每个任务获得独立的 Git worktree工作树通过 Task ID 绑定。两个平面分离:控制面(.tasks/,做什么)和执行面(.worktrees/,在哪做)。

对应规约概念§4 Sandbox / MicroVM 的轻量级版本——目录级别的隔离而非进程/VM 级别。


Nag Reminder催促提醒

定义Harness 在 Agent 连续 3 轮未更新 TodoWrite 时自动注入的提醒消息,督促模型回到计划轨道。

设计思想:不干预决策,只提醒纪律。约束聚焦,非限制。


Identity Re-injection身份重注入

定义:上下文压缩后,如果 Agent 的消息数量 ≤ 3 条,自动重新注入 Agent 身份信息块(名字、角色、职责)。

解决问题:压缩后 Agent 可能"忘记自己是谁"。身份重注入确保 Agent 保持自我意识。


Task-Process Data任务-过程数据)

定义Agent 在 Harness 中执行任务时产生的感知-推理-行动序列数据。这些数据是训练下一代 Agent 模型的原始材料。

意义Harness 不仅服务当前 Agent还为未来 Agent 改进提供训练信号。


九、关键人物

人物 角色 贡献
Matt Biilmann Netlify CEO 命名 AX (Agent Experience),推动 AX 作为设计学科
Jeremy Howard Answer.AI 联合创始人 提出 llms.txt 规范
janwilmake 开发者 创建 Agent-Friendly Web 原则仓库
Stefan Buck 开发者 创建 AI API Best Practices 仓库
Phil Schmid Hugging Face → 独立 MCP 最佳实践 6 条规则
Simon Willison Django 联合创始人 MCP 安全Prompt Injection深度分析
Dario Amodei / Anthropic Anthropic CEO 推动 MCP 标准 + AAIF 成立

九、行业组织

组织 定位 成员
AAIF Agent 标准治理Linux Foundation Anthropic, OpenAI, Block, AWS, Google, Microsoft
CoSAI 安全 AI 联盟 多方联合,发布 MCP 安全白皮书
OWASP Web/应用安全标准 社区驱动,发布 LLM/Agentic Top 10
AGNTCY "Agent 互联网"生态 75+ 公司Linux Foundation
OpenAPI Initiative API 描述标准 Google, Microsoft, IBM 等

十、市场数据速查

指标 数值 来源
开发者日常使用 AI 工具 89% Postman 2025
为 Agent 设计 API 的比例 24% Postman 2025
自动化流量超过人类流量 2024 年首次 Cloudflare
RAG Agent 流量增长 49% (2025 Q1) Apideck
AI 引荐流量转化率提升 +31% Adobe
AI 引荐单次访问收入提升 +254% Adobe
AI 零售支出 $20.9B (2026) eMarketer
Agentic AI 市场 $7B → $236B (2025→2034) 多方
B2B 采购 Agent 代理比例 90% by 2028 Gartner
B2B Agent 交易规模 $15T by 2028 Gartner
企业应用嵌入 Agent 40% by 2026 Gartner
组织有 Agent 在生产 11% (2025) Deloitte
Agent 项目失败率预测 40%+ by 2027 Gartner
Google 搜索零点击比例 58.5% SEM 研究
AI Overview 出现时 CTR 下降 61%+ 行业测试