- ZedIoT
-
-
-
- 引言:为什么 MCP 爆火了?
在过去几个月中,AI 技术从模型战进入到了 应用集成战。模型本身再强,如果无法访问实时数据、调用外部工具,就只能停留在“问答机”层面。
而这就是 MCP(Model Context Protocol) 诞生的背景:为 LLM 连接世界,提供一套统一调用工具的协议标准。
它像是 AI 世界的“USB”,让模型不再被训练数据所限制,而是能像人一样——
- 搜索资料 🔍
- 打开浏览器 🧭
- 管理 Notion 页面 🧾
- 查地图、订机票 📍
- 查询数据库、读写 Excel 📊
- …还能自我组合这些动作,变得真正“有手有脚”
2. 什么是 MCP?通俗解释 vs 工程定义
✅ 官方定义(engineering definition)
MCP(Model Context Protocol)是由 Anthropic 等推动的开放协议,旨在为大语言模型(LLMs)与外部数据源/工具之间的通信提供标准化规范。它通过定义统一的通信结构,使模型可以动态调用接口、访问数据、执行操作,从而打破静态提示限制。
📌 技术特性:
- 定义了客户端(Client)与服务端(Server)之间的通信流程
- 支持 Streaming 响应、多步骤调用、权限上下文传递等
- 类似于 AI 的 Function Calling 超集,可用于构建“智能体”级别的应用
✅ 通俗解释(human analogy)
MCP 就是 AI 的万能转接头 + 操作协议
你可以理解为:
- LLM 是操作系统(像手机)
- MCP 是蓝牙/USB 协议
- 各类外部工具(浏览器、数据库、搜索引擎)是外设(耳机、打印机、扫描仪)
如果没有 MCP,模型就像只能看书写字的学生;有了 MCP,它就能动手、联网、操作工具,成为真正的“智能体”。
3. 为何 MCP 比传统 API 更先进?
很多人疑问:我以前用 API 就能连接工具,为什么现在还需要 MCP?
答案是:传统 API 只是“你写程序去调工具”,而 MCP 是“模型自己调工具”。
对比维度 | 传统 API | MCP |
---|---|---|
谁来调用 | 人类程序员 | AI 模型自主调用 |
是否标准化 | 接口各自为政 | 统一协议、接口定义一致 |
支持多步骤任务 | ❌ 单次请求 | ✅ 可处理多步链式任务 |
上下文感知 | ❌ 无上下文 | ✅ 带上下文记忆 |
通信模型 | Request-Response | Dialog Prompting(持续交互) |
📌 简单说:MCP 是为 AI 设计的协议,而不是为程序员设计的协议。

图片来自:norahsakal 博客
4. GitHub 爆火:MCP Server 工具生态已经起来了
一个关键信号:这个标准不是纸上谈兵,MCP 工具生态正在爆发!
👇 GitHub 上这个项目:punkpeye/awesome-mcp-servers 已斩获超过 30,000 Stars,列出超过 3000 个 MCP Servers,涵盖 20+ 领域:
📌 部分 MCP Server 示例(来自开源生态):
Server 名称 | 功能 | 链接 |
---|---|---|
mcp-playwright | 浏览器自动化,支持点击/输入/JS执行 | GitHub |
notion_mcp | 管理 Notion 内容、模板、页面等 | GitHub |
arxiv-mcp-server | 查询论文、提取摘要、分析研究方法 | GitHub |
mcp-summarizer | 自动内容摘要支持 PDF、EPUB 等格式 | GitHub |
地图类 Server | 调用高德/百度/腾讯地图查路线、地理坐标 | 社区维护版本 |


💡 注:很多 Server 甚至已经开始支持多模型适配,不止用于 Claude,OpenAI、Gemini 也可用。
5. 一个 MCP 使用示例:让 AI 真正“出门干活”
📌 假设你对模型说:
“请帮我订一张明天下午飞巴黎的机票,并把行程同步到我的 Notion 日历上。”
没有 MCP,这个指令无法实现:
- 模型不知道航班数据
- 无法访问携程等接口
- 更不会往你的 Notion 写数据
有了 MCP,这一切都可能发生:
sequenceDiagram participant User participant LLM participant MCP_Server participant BookingAPI participant NotionAPI User->>LLM: 请帮我订机票并同步日历 LLM->>MCP_Server: 请求搜索航班 MCP_Server->>BookingAPI: 获取巴黎航班 BookingAPI-->>MCP_Server: 返回航班列表 MCP_Server-->>LLM: 提供航班选项 LLM->>MCP_Server: 调用下单 + Notion 日历接口 MCP_Server->>NotionAPI: 写入日程
👉 你看到的是“结果”,AI 模型在背后完成的是 MCP 多工具联动!
6. MCP 的三层架构:Host、Client、Server 各司其职
MCP 协议的标准通信架构包括三个核心角色:
组件 | 角色 | 作用 |
---|---|---|
Host | 模型运行端 | 提供模型界面,如 Claude Chat / VSCode 插件 / AI Agent |
Client | 中间代理 | 负责接收 Host 请求,转发到对应的 MCP Server |
Server | 工具服务 | 执行特定功能,如访问文件、搜索、生成图像等 |
📊 Mermaid 架构图:
graph TD; HOST[Host: LLM 聊天界面或插件] --> CLIENT[MCP Client: 中间通信者] CLIENT --> S1[MCP Server: 浏览器控制] CLIENT --> S2[MCP Server: PDF 解析器] CLIENT --> S3[MCP Server: 数据库访问器]
📌 说明:
- Host 是“发指令的人”,如 Claude 对话界面
- Client 是“翻译+调度员”,根据任务将请求派送到不同的 Server
- Server 是“真正动手干活的人”,执行任务并返回结构化结果
7. MCP Server 是如何工作的?(开发者视角)
MCP Server 是 MCP 生态的最小工作单元,每个 Server 是一个“可被 AI 控制的工具”。
✅ Server 的核心职责:
- 暴露一个标准化 JSON 接口(OpenAPI 格式)
- 声明自己能做什么(metadata)
- 接收来自 MCP Client 的标准请求,执行操作,返回响应
📦 Server 文件结构示例(以 mcp-browser
为例):
📁 mcp-browser/
├── openapi.yaml # 功能定义文件
├── main.py # FastAPI 启动逻辑
├── actions.py # 执行具体操作,如浏览器控制
├── metadata.json # MCP Server 元信息定义
└── requirements.txt # 所需依赖
🔧 示例代码片段(使用 FastAPI 开发一个简单“计算器” Server):
from fastapi import FastAPI
from pydantic import BaseModel
app = FastAPI()
class Operation(BaseModel):
a: float
b: float
op: str
@app.post("/calculate")
def calculate(op: Operation):
if op.op == "add":
return {"result": op.a + op.b}
if op.op == "sub":
return {"result": op.a - op.b}
return {"error": "Unsupported"}
同时配置一个 metadata.json
:
{
"name": "calculator-mcp-server",
"description": "Basic arithmetic operations",
"url": "http://localhost:8000",
"openapi_spec": "/openapi.json"
}
📌 这就完成了一个可被 AI 模型通过 MCP 调用的工具。
8. 如何注册并连接多个 Server?
每个 MCP Client 可以配置多个 MCP Server,所有 Server 会注册到 registry
中(可为本地 JSON 文件或远程配置中心)。
✅ 典型注册结构:
[
{
"name": "notion",
"description": "Notion 内容写入",
"url": "http://localhost:3001",
"openapi": "/openapi.json"
},
{
"name": "search",
"description": "调用搜索引擎",
"url": "http://localhost:3002",
"openapi": "/openapi.json"
}
]
📌 Claude、LangChain、AutoGPT 等 Agent 系统将通过 MCP Client 从中检索可用 Server,根据对话语境决定调用哪个工具。
9. 与 RAG / Agent 的协同机制:从“提示词堆叠”到“链式智能系统”
MCP 不孤立存在,它天然是 Agent 架构的外延,而 RAG 是它的数据输入源。三者配合使用,形成一个强大的“AI 多工链”。
📊 三者协同关系图:
flowchart TD U[用户指令] --> AG[Agent 系统] AG --> RAG[调用 RAG 检索资料] AG --> MCP[调用 MCP 工具 Server] RAG --> CONTEXT[提供增强知识上下文] MCP --> RESULT[返回执行结果] CONTEXT --> AG RESULT --> AG AG --> RESPONSE[最终响应输出]
✅ 实战示例:PDF+搜索+摘要
“帮我提取这个 PDF 的内容,然后用你能找到的资料补充背景,并生成摘要。”
- Agent:分解任务(提取、检索、生成)
- RAG:连接企业知识库 + Wikipedia API
- MCP Server:
pdf-reader
: 解析 PDF 文档search
: 搜索相关背景summarizer
: 整合成摘要
📌 LLM 只负责调用,不负责操作,操作交给 Server 去完成!
✅ MCP 的作用在于:
- 🎯 标准化工具调用接口
- 🧠 赋能 Agent 实际行动能力
- 🔄 与 RAG 联动,动态构建上下文
以下是标准 Blog 的第三部分(3/3),我们将聚焦 MCP 工具生态的趋势、企业落地实践、与 Function Calling / 插件体系的比较,以及未来的挑战与发展方向。
10. 工具生态爆发:MCP 是新的“插件系统”?
正如 awesome-mcp-servers 所展示,MCP 已形成了初步的开发者生态,正在逐渐取代传统插件与 Function Calling 成为主流AI 工具集成方式。
✅ 当前 MCP Server 已覆盖的能力包括:
- 🧭 浏览器控制(基于 Playwright)
- 📄 PDF / EPUB / Word 文档解析
- 🔎 搜索引擎调用(DuckDuckGo, Brave, Bing API)
- 🧠 语义检索(向量数据库)
- 📅 日历、Notion、数据库(MySQL, MongoDB)
- 🔍 Arxiv / PubMed / Hacker News 检索
- 📈 数据分析 / 图表自动化
任何 AI 工程师都可以通过编写一个符合 openapi.json + metadata.json 的 MCP Server,将自己的工具“注册”进智能体系统中。
📌 趋势对比:
模型扩展机制 | 功能集成模式 | 易用性 | 开发门槛 | 扩展性 |
---|---|---|---|---|
Plugin(OpenAI) | 基于手工注册的插件系统 | 中 | 中等 | 有限制 |
Function Calling | 代码级接口(仅语义层调度) | 高 | 高 | 中等 |
MCP | 标准协议 + 自动发现 + 多步骤对话支持 | 高 | 低 | 极强 ✅ |
👉 MCP 更像是未来 LLM 工具生态的“标准总线”,可以横向扩展、自动注册、兼容任何 LLM。
11. 企业如何构建 MCP 工具链?
🏢 应用场景一:智能客服系统
目标:实现“自助式知识问答 + 工单提交 + 外部系统操作”三位一体
组件 | 技术实现 |
---|---|
RAG | 连接企业知识库(通过 FAISS、Pinecone) |
MCP Server 1 | 查询产品文档的搜索 API |
MCP Server 2 | 生成故障工单并提交到客服系统 |
MCP Server 3 | 自动查表/生成图表汇总投诉数据 |
📌 用户体验:客服 AI 既能查文档回答,又能创建工单、更新数据库。
💼 应用场景二:财务/法务 AI 助理
目标:审查合同 + 比对政策 + 生成审计报告
- 利用 RAG 抽取法规
- Agent 控制流程执行
- MCP Server 执行:
- PDF 文档结构化提取
- 关键条款抓取与比较
- 报告撰写并自动入库
📌 一键完成审计任务,节省人工成本 80%。
✅ 总结:MCP 会成为 AI 应用生态的基础设施吗?
📌 结合官网 mcp.so 和开发者社区观察,MCP 未来可能朝以下方向演进:
- 支持多模态模型调用: 不止文本,未来可能开放图像识别、视频操作等能力
- MCP Hub 平台化: 出现类似“Plugin Store”的 MCP Server 注册发现市场
- 结合 RAG 与 Agent 标准: 将 LangChain / AutoGen / LangGraph 等框架无缝对接 MCP
- 跨平台适配: GPT-4 / Claude / Gemini / DeepSeek 等主流模型均可基于 MCP 统一调用外部世界
回到最初的问题——为什么大家都在谈 MCP?
MCP 的意义远不止“新协议”这么简单,它代表的是 AI 系统由“封闭语言模型”向“开放智能体”进化的关键一步:
- ✨ 过去,大模型像“图灵机”,闭门造车
- ⚙️ 现在,有了 RAG,它能获取外部知识
- 🧠 有了 Agent,它能思考并规划任务
- 🔌 有了 MCP,它能真正“动手”去执行每个任务!
这三者组成的,是具备感知、认知、行动的 AI 工作流闭环。
📌 MCP 是其中“连接现实世界”的那一环,是 AI 迈出屏幕、介入系统、真正“能办事”的关键。
📎 附件推荐阅读资源
- awesome-mcp-servers:MCP Server 工具索引
- norahsakal 博客:MCP vs API 深度剖析
- MCP 官方网站
典型应用介绍