mcp~客户端与服务端的通讯技术
mcp通讯协议
- stdio
- sse
- streamable http
JSON_RPC
MCP 的传输层负责将 MCP 协议消息转换为 JSON-RPC 格式进行传输,并将接收到的 JSON-RPC 消息转换回 MCP 协议消息
- 请求
{
jsonrpc: "2.0",
id: number | string,
method: string,
params?: object
}
- 响应
{
jsonrpc: "2.0",
id: number | string,
result?: object,
error?: {
code: number,
message: string,
data?: unknown
}
}
一 stdio
本地化部署mcp server后,本机上的gpt工具集成了mcp client skd,然后通过本地进程与mcp server进行通讯
二 sse
MCP 早期采用 HTTP+SSE(Server-Sent Events)实现客户端与服务器的通信,但存在以下问题:
- 不支持断线恢复:SSE 连接中断后会话状态丢失,需重新开始。
- 服务器资源压力大:需为每个客户端维护长连接,高并发时资源消耗显著。
- 单向通信限制:服务器只能通过 SSE 端点单向推送消息,无法灵活处理双向交互。
- 基础设施兼容性差:CDN、防火墙等可能中断长连接,导致服务不可靠。
客户端和服务端通讯原理
- 客户端向服务服务/sse节点发起get请求,它是一个长连接,
connection keep-alive,accept text/event-stream - 服务端返回endpoint节点,并带上sessionId标识,之后服务端向客户端推送的数据,也是从这个/sse节点完成
- 客户端向endpoint节点发起post请求,将问题以请求体的形式发给mcp server
- mcp server获取当前endpoint+sessionId,对请求体处理,并通过/sse接口推送到客户端

sdk处理流程

实际工作过程总结
连接建立
客户端请求 /sse;
服务端初始化 SseEmitter 和 McpServerSession,返回可用的消息接口地址。
会话初始化
客户端通过 /message 发送 InitializeRequest,告知能力与标识;
服务端处理后通过 SSE 返回 InitializeResponse。
资源管理
客户端发起如 tools/list 请求;
服务端从会话中查找状态,调用工具处理器并通过 SSE 返回结果。
调用工具
客户端拼接 prompt 后发起 tools/call;
服务端查找处理器执行逻辑,并通过 SSE 返回执行结果。
连接维持
客户端周期性发送 ping;
服务端返回 pong,用于保持连接活跃。
连接关闭
客户端主动断开;
服务端清理对应的连接与会话状态。
java-webflux正确引用
使用快照版1.0.0-SNAPSHO,引用包spring-ai-starter-mcp-server-webflux
<dependencies>
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-mcp-server-webflux</artifactId>
</dependency>
</dependencies>
<dependencyManagement>
<dependencies>
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-bom</artifactId>
<version>1.0.0-SNAPSHOT</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>
使用标准版1.0.0-M6,引用包spring-ai-mcp-server-webflux-spring-boot-starter会出现无sessionId参数的问题
三 streamable http
Streamable HTTP 通过以下设计解决了SSE的问题:
统一端点
移除专用的 /sse 端点,所有通信通过单一端点(如 /mcp)完成,支持 POST 和 GET 请求。按需流式传输
服务器可灵活选择响应方式:- 普通 HTTP 响应:适用于简单请求(如计算任务)。
- 升级为 SSE 流:用于需持续推送的场景(如进度反馈)。
- 维持长连接:支持双向流式交互(如多轮对话)。
会话标识与状态管理
引入会话 ID 机制(通过 Mcp-Session-Id 头部传递),支持断线重连和状态恢复。服务器可选择无状态(Stateless)或有状态(Stateful)模式运行。灵活初始化与恢复
- 客户端可通过空 GET 请求主动初始化 SSE 流。
- 断线后,客户端可通过会话 ID 重新连接并恢复上下文。
Streamable HTTP 的优势
- 兼容性与扩展性
- 纯 HTTP 实现,兼容 CDN、API 网关等现有基础设施。
- 支持无状态服务器,适合 Serverless 架构(如 AWS Lambda)。
- 性能优化
- 复用 TCP 连接,减少高并发下的连接数(测试显示,1000 并发用户时连接数仅为 HTTP+SSE 的 1/10)。
- 平均响应时间更短(Streamable HTTP 为 0.0075s,HTTP+SSE 为 1.5112s)。
- 客户端简化
- 相比 HTTP+SSE 需维护双通道,Streamable HTTP 客户端代码量减少 40% 以上,仅需处理统一端点。
- 灵活部署
- 支持无状态模式,避免强制粘性会话(Sticky Session),便于水平扩展。
- 适用于云原生架构,如 Kubernetes 动态扩缩容。
典型应用场景
- 无状态服务(如数学计算工具)
客户端直接发送 POST 请求,服务器返回即时 HTTP 响应,无需维护会话。
- 流式进度反馈(如大文件处理)
服务器通过 SSE 流分阶段推送进度(如 10%、30%),完成后关闭连接。
- 多轮对话 AI(如上下文感知助手)
初始化会话后,通过会话 ID 维持上下文,支持多轮交互与断线恢复。
- 弱网络环境
网络中断后,客户端可携带会话 ID 重新连接,从断点继续任务。
开发语言的选择
mcp-java-sdk 暂未支持新版 Streamable HTTP 协议,需要继续使用SSE实现,当然你也可以采用pyton-sdk,它是有支持的。

mcp~客户端与服务端的通讯技术的更多相关文章
- Docker学习笔记 - Docker客户端和服务端
学习内容: Docker客户端和服务端的通讯方式:client和自定义程序 Docker客户端和服务端的连接方式:socket 演示Docker客户端和服务端之间用remote-api通讯:nc ...
- java客户端与服务端交互通用处理 框架解析
一.综述 java 客户端与服务端交互过程中,采用NIO通讯是异步的,客户端基本采用同一处理范式,来进行同异步的调用处理. 处理模型有以下几个要素: 1. NIO发送消息后返回的Future 2. 每 ...
- 在HTTP通讯过程中,是客户端还是服务端主动断开连接?
比如说:IE访问IIS,获取文件,肯定是要建立一个连接,这个连接在完成通讯后,是客户端Close了连接,还是服务端Close了连接.我用程序测模拟IE和IIS,都没有收到断开连接的消息,也就是都没有触 ...
- 基于socket.io客户端与服务端的相互通讯
socket.io是对websocket的封装,用于客户端与服务端的相互通讯.官网:https://socket.io/. 下面是socket.io的用法: 1.由于使用express开的本地服务,先 ...
- Web端即时通讯技术盘点:短轮询、Comet、Websocket、SSE
1. 前言 Web端即时通讯技术因受限于浏览器的设计限制,一直以来实现起来并不容易,主流的Web端即时通讯方案大致有4种:传统Ajax短轮询.Comet技术.WebSocket技术.SSE(Serve ...
- 新手入门:史上最全Web端即时通讯技术原理详解
前言 有关IM(InstantMessaging)聊天应用(如:微信,QQ).消息推送技术(如:现今移动端APP标配的消息推送模块)等即时通讯应用场景下,大多数都是桌面应用程序或者native应用较为 ...
- Web端即时通讯技术原理详解
前言 有关IM(InstantMessaging)聊天应用(如:微信,QQ).消息推送技术(如:现今移动端APP标配的消息推送模块)等即时通讯应用场景下,大多数都是桌面应用程序或者native应用较为 ...
- 新手入门贴:史上最全Web端即时通讯技术原理详解
关于IM(InstantMessaging)即时通信类软件(如微信,QQ),大多数都是桌面应用程序或者native应用较为流行,而网上关于原生IM或桌面IM软件类的通信原理介绍也较多,此处不再赘述.而 ...
- SignalR 实现web浏览器客户端与服务端的推送功能
SignalR 是一个集成的客户端与服务器库,基于浏览器的客户端和基于 ASP.NET 的服务器组件可以借助它来进行双向多步对话. 换句话说,该对话可不受限制地进行单个无状态请求/响应数据交换:它将继 ...
- Java实现UDP之Echo客户端和服务端
Java实现UDP之Echo客户端和服务端 代码内容 采用UDP协议编写服务器端代码(端口任意) 编写客户机的代码访问该端口 客户机按行输入 服务器将收到的字符流和接收到的时间输出在服务器consol ...
随机推荐
- 【Spring】Spring的@Autowire注入Bean的规则测试
背景 在项目中使用Spring的Bean,一般都使用默认的Bean的单例,并且结合@Autowire使用. 实在有同一个类型多个实例的情况,也使用@Qualifier或@Resource实现注入. 所 ...
- 【攻防世界】warmup
warmup (反序列化与sql注入) 题目来源 攻防世界 NO.GFSJ0999 题目描述 题目提示:平平无奇的输入框 打开网址页面如下,没有有用信息. 题目给了附件,直接下载,得到源码如下: in ...
- Windows 提权-SeBackupPrivilege 特权
本文通过 Google 翻译 Sebackupprivilege – Windows Privilege Escalation 这篇文章所产生,本人仅是对机器翻译中部分表达别扭的字词进行了校正及个别注 ...
- 【Abaqus】材料行为的非均匀空间分布
设想一种情况:在有限元分析中,一个区域或者整个网格中,每个单元的材料行为都是单独的.这时在ABAQUS中应该如何设置? 两种办法: 给每个单元创建一个集合,然后一一赋予SECTION. 使用*Dist ...
- idea 导入普通的项目后,无法发布
之前一直都是在eclipse开发,现在改idea,但是很多隐藏的功能,都不晓得在哪里找到. 问题: 新导入一个spring 项目(没有maven),在界面上看是没有问题,但是使用tomcat部署项目的 ...
- golang 使用goto进行多错误处理
goto 语句介绍 在 Go 语言中,可以通过goto语句跳转到标签,进行代码间的无条件跳转.另外,goto语句在快速跳出循环.避免重复退出方面可以简化代码实现过程,但在结构化程序设计中一般不主张使用 ...
- Windows 提权-服务_弱注册表权限
本文通过 Google 翻译 Weak Registry Key Permissions – Windows Privilege Escalation 这篇文章所产生,本人仅是对机器翻译中部分表达别扭 ...
- 《视觉SLAM十四讲》第13讲 设计SLAM系统 回环检测线程的实现
<视觉SLAM十四讲>第13讲 设计SLAM系统 回环检测线程的实现 这个学期看完了高翔老师的<视觉SLAM十四讲>,学到了很多,首先是对计算机视觉的基本知识有了一个更加全面系 ...
- 模型即产品?从应用角度看AI产品发展趋势
提供AI咨询+AI项目陪跑服务,有需要回复1 在ChatGPT发布后的两年里,AI应用层的发展可以用一个词来评价不温不火,到去年年初时甚至有些疲软的情况.其原因有三点: 第一,算力不足,模型API响应 ...
- [每日算法 - 华为机试] leetcode680. 验证回文串 II
入口 力扣https://leetcode.cn/problems/valid-palindrome-ii/submissions/ 题目描述 给你一个字符串 s,最多 可以从中删除一个字符. 请你判 ...