一、介绍

TCP一种面向连接的、可靠的、基于字节流的传输层协议。

三次握手:

  1. 客户端发送服务端连接请求,等待服务端的回复。
  2. 服务端收到请求,服务端回复客户端,可以建立连接,并等待。
  3. 客户端收到回复并发送,确认连接。服务端收到回复。连接成功。



    四次挥手:

与三次握手不同,客户端和服务端都可以主动断开连接。

  1. 服务A向服务B发送FIN报文段,表示没有数据要传输
  2. 服务B收到报文段,回复一个ACK报文段,表示也没有数据需要传输了。
  3. 服务B发送FIN报文段,请求关闭连接。
  4. 服务A收到报文段,服务B发送ACK报文段,服务B收到报文段后直接关闭连接,服务A没有收到回复,也开始断开连接。

因为复杂的三次握手和四次挥手,保证了数据的可靠性和安全性。因此也造成了更大的开销。

二、产生的问题

由于TCP的可靠性传输,可以理解为客户端和服务端之间建立了一个传输管道,可以互相不断的传输数据。但是可能由于数据的传输与接收之间存在差异。使用在服务端和客户端之间,存在一个缓冲区,用于数据的缓冲。数据传输之前会先到缓冲区。

例如服务端A和客户端B。A不断向服务端传输数据,B不断处理服务A传输的数据。服务A发送数据到缓冲区,服务B从缓冲区获取数据来处理。由于服务B处理的速度比较慢,就会导致缓冲区堆积多个数据包。当服务B处理完再取时,取出的可能是多个数据包粘在一起的数据包,这时候处理就会出现问题。

三、解决方案

设置包长、包头包尾、消息分隔符解决粘包和拆包问题。这些方法通过明确消息边界,确保接收端能够准确地解析每个完整的消息。这里举例数据包分隔符。

1、设置包头包尾

现在我们模拟粘包情况,也就是客户端数据堆积。

Server

import socket
import time def receive_message(sock):
buffer = b""
while True:
packet = sock.recv(1024)
if not packet:
break
buffer += packet
print("缓冲区数据 : "+ str(buffer))
time.sleep(5)
while True:
start_index = buffer.find(b"StartPackage")
end_index = buffer.find(b"EndPackage")
if start_index != -1 and end_index != -1 and start_index < end_index:
start_index += len(b"StartPackage")
message = buffer[start_index:end_index]
buffer = buffer[end_index + len(b"EndPackage"):]
print("收到客户端消息: "+message.decode())
else:
break server_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_sock.bind(('localhost', 8888))
server_sock.listen(1) client_sock, _ = server_sock.accept() receive_message(client_sock)
client_sock.close()
server_sock.close()

Client

import socket
import time def send_message(sock, message):
packet = b"StartPackage" + message.encode() + b"EndPackage"
sock.sendall(packet) sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('localhost', 8888)) for i in range(1,11,1):
message = "Hello, world!--"+str(i)
send_message(sock, message)
print("发送消息 "+message)
time.sleep(1)
sock.close()

根据服务端输出可以看到,缓冲区已经出现粘包,多个数据包堆积到一起,这里利用包头包尾进行拆包,确保数据的完整性。

2、设置包长

Server

import socket
import struct
import time def receive_message(sock):
buffer = b""
while True:
packet = sock.recv(1024)
if not packet:
break
buffer += packet
print(f"缓冲区数据 : {buffer}") while len(buffer) >= 4:
header = buffer[:4]
message_length = struct.unpack('>I', header)[0]
print(f"包长为: {message_length}") if len(buffer) < 4 + message_length:
break start_index = 4
end_index = 4 + message_length
message = buffer[start_index:end_index]
buffer = buffer[end_index:]
print(f"收到客户端消息: {message.decode()} ")
time.sleep(5) server_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_sock.bind(('localhost', 8888))
server_sock.listen(1)
client_sock, _ = server_sock.accept()
receive_message(client_sock)
client_sock.close()
server_sock.close()

Client

import socket
import struct
import time def send_message(sock, message):
message_bytes = message.encode()
message_length = len(message_bytes)
header = struct.pack('>I', message_length)
packet = header + message_bytes
sock.sendall(packet) sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('localhost', 8888)) for i in range(1, 11):
message = "Hello, world!--" + str(i)
send_message(sock, message)
print(f"发送消息:{message}" )
time.sleep(1) sock.close()

可以看到由于处理的时间过长,导致数据堆积在缓冲区形成粘包。通过在消息头部设置包长,确定数据包的完整性。通过包长将粘包进行拆包。

3、设置包分隔符

Server

import socket
import time def receive_message(sock):
buffer = b""
delimiter = b"<END>"
while True:
packet = sock.recv(1024)
if not packet:
break
buffer += packet
print("f缓冲区数据: {buffer} ") while True:
end_index = buffer.find(delimiter)
if end_index != -1:
message = buffer[:end_index]
buffer = buffer[(end_index + len(delimiter)):]
print(f"收到客户端消息: { message.decode()} ")
else:
break
time.sleep(5) server_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_sock.bind(('localhost', 8888))
server_sock.listen(1)
client_sock, _ = server_sock.accept()
receive_message(client_sock)
client_sock.close()
server_sock.close()

Client

import socket
import time def send_message(sock, message):
delimiter = b"<END>"
packet = message.encode() + delimiter
sock.sendall(packet) sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('localhost', 8888)) for i in range(10):
message = "Hello, world!--" + str(i)
send_message(sock, message)
print(f"发送消息: {message}")
time.sleep(1)
sock.close()

可以看到也是出现了数据堆积,粘包,但是最后打印的结果是正确的。通过使用数据包分隔符,保证数据的完整性。

四、总结

TCP粘包问题是由于TCP的流式传输特点导致的,在传输过程中多个数据包可能会粘在一起。粘包问题会导致接收端无法正确解析数据包,因为接收端无法区分哪些字节属于哪个数据包,可能会出现数据包内容混乱或不完整的情况。为了解决这个问题,可以使用固定长度消息、消息分隔符、消息头加消息体、应用层协议等方法。具体选择哪种方法需要根据应用场景和需求来确定。

【Socket】解决TCP粘包问题的更多相关文章

  1. python套接字解决tcp粘包问题

    python套接字解决tcp粘包问题 目录 什么是粘包 演示粘包现象 解决粘包 实际应用 什么是粘包 首先只有tcp有粘包现象,udp没有粘包 socket收发消息的原理 发送端可以是一K一K地发送数 ...

  2. Netty使用LineBasedFrameDecoder解决TCP粘包/拆包

    TCP粘包/拆包 TCP是个”流”协议,所谓流,就是没有界限的一串数据.TCP底层并不了解上层业务数据的具体含义,它会根据TCP缓冲区的实际情况进行包的划分,所以在业务上认为,一个完整的包可能会被TC ...

  3. 深入学习Netty(5)——Netty是如何解决TCP粘包/拆包问题的?

    前言 学习Netty避免不了要去了解TCP粘包/拆包问题,熟悉各个编解码器是如何解决TCP粘包/拆包问题的,同时需要知道TCP粘包/拆包问题是怎么产生的. 在此博文前,可以先学习了解前几篇博文: 深入 ...

  4. socket编程 TCP 粘包和半包 的问题及解决办法

    一般在socket处理大数据量传输的时候会产生粘包和半包问题,有的时候tcp为了提高效率会缓冲N个包后再一起发出去,这个与缓存和网络有关系. 粘包 为x.5个包 半包 为0.5个包 由于网络原因 一次 ...

  5. netty 解决TCP粘包与拆包问题(二)

    TCP以流的方式进行数据传输,上层应用协议为了对消息的区分,采用了以下几种方法. 1.消息固定长度 2.第一篇讲的回车换行符形式 3.以特殊字符作为消息结束符的形式 4.通过消息头中定义长度字段来标识 ...

  6. netty 解决TCP粘包与拆包问题(一)

    1.什么是TCP粘包与拆包 首先TCP是一个"流"协议,犹如河中水一样连成一片,没有严格的分界线.当我们在发送数据的时候就会出现多发送与少发送问题,也就是TCP粘包与拆包.得不到我 ...

  7. 1. Netty解决Tcp粘包拆包

    一. TCP粘包问题 实际发送的消息, 可能会被TCP拆分成很多数据包发送, 也可能把很多消息组合成一个数据包发送 粘包拆包发生的原因 (1) 应用程序一次写的字节大小超过socket发送缓冲区大小 ...

  8. c#解决TCP“粘包”问题

    一:TCP粘包产生的原理 1,TCP粘包是指发送方发送的若干包数据到接收方接收时粘成一包,从接收缓冲区看,后一包数据的头紧接着前一包数据的尾.出现粘包现象的原因是多方面的,它既可能由发送方造成,也可能 ...

  9. 【转】Netty之解决TCP粘包拆包(自定义协议)

    1.什么是粘包/拆包 一般所谓的TCP粘包是在一次接收数据不能完全地体现一个完整的消息数据.TCP通讯为何存在粘包呢?主要原因是TCP是以流的方式来处理数据,再加上网络上MTU的往往小于在应用处理的消 ...

  10. Netty之解决TCP粘包拆包(自定义协议)

    1.什么是粘包/拆包 一般所谓的TCP粘包是在一次接收数据不能完全地体现一个完整的消息数据.TCP通讯为何存在粘包呢?主要原因是TCP是以流的方式来处理数据,再加上网络上MTU的往往小于在应用处理的消 ...

随机推荐

  1. 分享一款嵌入式开源按键框架代码工程MultiButton

    一.工程简介 MultiButton 是一个小巧简单易用的事件驱动型按键驱动模块. Github地址:https://github.com/0x1abin/MultiButton 这个项目非常精简,只 ...

  2. 笔记本电脑上的聊天机器人: 在英特尔 Meteor Lake 上运行 Phi-2

    对应于其强大的能力,大语言模型 (LLM) 需要强大的算力支撑,而个人计算机上很难满足这一需求.因此,我们别无选择,只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上. 为何需要将 LL ...

  3. Redis介绍、使用、数据结构和集群模式总结

    Redis(Remote Dictionary Server)是一个开源的,基于内存的数据结构存储系统,它支持多种数据结构,如字符串(String).列表(List).集合(Set).有序集合(Sor ...

  4. 本地使用ts配置

    1.需要安装的依赖 "dependencies": { "html-webpack-plugin": "^5.5.0", "ts- ...

  5. WebRTC获取IP地址问题,Uncaught TypeError: Cannot read property '1' of null

    WebRTC获取IP地址问题,Uncaught TypeError: Cannot read property '1' of null 临时接了个任务,客户要求某个账号只能在某个ip或者mac上登录, ...

  6. 从零开始入门 K8s | 调度器的调度流程和算法介绍

    导读:Kubernetes 作为当下最流行的容器自动化运维平台,以声明式实现了灵活的容器编排,本文以 v1.16 版本为基础详细介绍了 K8s 的基本调度框架.流程,以及主要的过滤器.Score 算法 ...

  7. SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可监控)

    简介: 本篇是"SpringCloud 应用在 Kubernetes 上的最佳实践"系列文章的第六篇,主要介绍了如何保障生产环境服务稳定,做到随时发布,从而加快业务的迭代和上线速度 ...

  8. Spring Cloud Bus 消息总线介绍

    简介: 本文配套可交互教程已登录阿里云知行动手实验室,PC 端登录 start.aliyun.com 在浏览器中立即体验. 作者 | 洛夜来源 | 阿里巴巴云原生公众号 本文配套可交互教程已登录阿里云 ...

  9. 配置审计(Config)变配报警设置

    简介: 本文作者[紫极zj],本篇将主要介绍通过配置审计的自定义规则等服务,对负载均衡进行预警行为的相关介绍. 前言 配置审计(Config)将您分散在各地域的资源整合为全局资源列表,可便捷地搜索全局 ...

  10. AI让边缘更智能 边缘让AI无处不在

    ​简介: 城市管理和城市服务逐步走向智能化,智慧化.到2019底,全国100%的副省级城市,95%以上的地级市,以及50%以上的县级市均提出建设新型智慧城市,并已经有32个主要城市成立了专门的大数据管 ...