【Socket】解决UDP丢包问题
一、介绍
UDP是一种不可靠的、无连接的、基于数据报的传输层协议。相比于TCP就比较简单,像写信一样,直接打包丢过去,就不用管了,而不用TCP这样的反复确认。所以UDP的优势就是速度快,开销小。但是随之而来的就是不稳定,面向无连接的,无法确认数据包。会导致丢包问题。

二、丢包原因
1、服务未启动或出现故障,但是数据包依然发送出去,目标地址和端口没有任何进程在监听,这些数据包将被丢弃。
2、缓冲区满,数据包溢出丢失。在实际情况中,如果处理的速度比较慢,会导致数据包堆积在缓冲区,当缓冲区满时,发送的数据无处存放就会丢失。另一种情况是发送的数据包非常大时,可能这个数据包直接超出了缓冲区的大小,也会导致数据丢失。最后一种情况和第一种差不多,由于发送的速率过快,导致处理不及时。
Client
import socket
import time
def main():
server_host = "127.0.0.1"
server_port = 8888
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as client_sock:
i = 0
while True:
message = b"Hello, server!"
client_sock.sendto(message, (server_host, server_port))
i = i + 1
time.sleep(0.001)
if i == 100000:
break
if __name__ == "__main__":
main()
Serevr
import socket
import time
def main():
host = "127.0.0.1"
port = 8888
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as server_sock:
server_sock.bind((host, port))
i= 0
while True:
data, client_addr = server_sock.recvfrom(1024)
print("接收来自", client_addr, "的消息:", data.decode())
if i==0:
time.sleep(10)
i+=1
print(i)
if __name__ == "__main__":
main()
这里的客户端发送了100000个数据包,在服务端特意设置处理第一个数据包后停止10秒模拟数据处理时间。在这种情况下,就会因为速度过快,缓冲区满而导致数据包丢失。服务端最后的打印为

可以看到只接收到了96521个数据包,后面的因为缓冲区满的原因全部丢失。这里不会像TCP一样堆积数据包会粘包,UDP不会,而是会一次取一个,按顺序取。不同的设置的缓冲区大容量不同。
三、避免丢包
既然我们知道了丢包的原因,那么在好实际开发中我们应尽量避免丢包问题。
1、在接收端人为创建缓冲区,也即是说,如果一个数据包处理的时间很长,那么我们可以将接收和处理分开,将接收的数据存储到代码层面。
2、再遇见数据包很大时,可以采用分片多次传输,最后将数据在接收端汇总处理,避免数据堆积。
3、解决方案:接收处理分离
这里使用多进程来处理数据,与接收数据使用不同的线程,互不影响,这样不会导致数据包的接收速度,所以缓冲区不会堆积,避免数据包的丢失。手动创建了一个本地数据缓冲区,使用一个列表将接收的数据存储,使用多进程不断处理。这里相当于队列是一个本地缓冲区,可以避免数据丢包,但是需要注意的是本地缓冲区不能也不能超过大小。
Client
import socket
import time
def main():
server_host = "127.0.0.1"
server_port = 8888
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as client_sock:
i = 0
while True:
message = b"Hello, server!"
client_sock.sendto(message, (server_host, server_port))
i = i + 1
time.sleep(0.001)
if i == 100000:
break
if __name__ == "__main__":
main()
Server
from multiprocessing import Queue
import socket
import time
from multiprocessing import Process
def task(data_list:Queue):
'''模拟处理处理'''
while True:
data = data_list.get()
time.sleep(10)
def main():
host = "127.0.0.1"
port = 8888
data_list = Queue()
i= 0
work = Process(target=task, args=(data_list,))
work.daemon = True
work.start()
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as server_sock:
server_sock.bind((host, port))
while True:
data, _ = server_sock.recvfrom(1024)
data_list.put(data)
i+=1
print(i)
if __name__ == "__main__":
main()
四、解决丢包
1、回复机制
Server
import socket
def main():
host = "127.0.0.1"
port = 8888
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as server_sock:
server_sock.bind((host, port))
while True:
data, client_addr = server_sock.recvfrom(1024)
print("接收到来自", client_addr, "的消息:", data.decode())
ack_message = "ACK".encode()
server_sock.sendto(ack_message, client_addr)
if __name__ == "__main__":
main()
Client
import socket
import time
def main():
server_host = "127.0.0.1"
server_port = 8888
message = ["Hello, server!"]*10
timeout = 2
i = 0
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as client_sock:
client_sock.settimeout(timeout)
while i<len(message):
try:
client_sock.sendto(message[i].encode(), (server_host, server_port))
print(f"发送消息: {message[i]}--{i}")
ack, _ = client_sock.recvfrom(1024)
if ack.decode() == "ACK":
print("接收到确认消息: ACK")
i+=1
continue
except socket.timeout:
print(f"未接收到确认消息,重传数据包")
time.sleep(1)
if __name__ == "__main__":
main()
这里通过回传机制确定数据正常到达,服务端接收到数据必须在指定时间内给予回复,否则默认数据包丢失,将上一次消息重发,这样可以解决数据丢包。(注意服务端必须给予回复,否则将会一直收到重复消息。)
2、奇偶检验
用于检测数据包是否错误,这里指的是数据包破损,导致数据包是不完整的,这时候使用回复机制无法找到错误,这里使用奇偶检验就可以解决这个问题。客户端除了在指定时间内需要接收数据外,还要根据回复的消息判断数据包是否破损。
Server
import socket
def verify_and_correct(data):
'''检验奇偶检验码'''
received_data = data[:-1]
received_parity = data[-1]
calculated_parity = sum(bytearray(received_data)) % 256
if calculated_parity == received_parity:
return received_data.decode(), True
else:
return None, False
def main():
host = "127.0.0.1"
port = 8888
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as server_sock:
server_sock.bind((host, port))
while True:
data, client_addr = server_sock.recvfrom(1024)
message, is_correct = verify_and_correct(data)
if is_correct:
print("接收到来自", client_addr, "的消息:", message)
ack_message = "True".encode()
server_sock.sendto(ack_message, client_addr)
else:
print("接收到来自", client_addr, "的错误消息")
ack_message = "False".encode()
server_sock.sendto(ack_message, client_addr)
if __name__ == "__main__":
main()
Client
import socket
def calculate_parity(data):
'''计算奇偶检验码'''
parity = sum(bytearray(data)) % 256
return parity
def main():
server_host = "127.0.0.1"
server_port = 8888
message = "Hello, server!"
message_bytes = message.encode()
parity_byte = calculate_parity(message_bytes)
packet = message_bytes + parity_byte
with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as client_sock:
while True:
client_sock.sendto(packet, (server_host, server_port))
print(f"发送消息: {message}")
client_sock.settimeout(3)
try:
ack, _ = client_sock.recvfrom(1024)
if ack.decode() == "True":
print("数据已成功接收")
break
else:
print("数据破损,重传中...")
except socket.timeout:
print("超时,重传中...")
if __name__ == "__main__":
main()
3、前向纠错
这种情况比较复杂,是通过更复杂的编码方案规则,在数据中添加冗余数据用于数据纠错。根据自己定义的一套规则,将判断规则需要的数据,添加到数据包中,冗余数据用于来纠错。例如海明码(这里不做具体举例,因为比较复杂)
五、总结
UDP(用户数据报协议)是一种无连接的传输层协议,因其不保证数据包的顺序到达和不具备内置重传机制,导致在网络拥塞、接收缓冲区溢出或发送频率过快等情况下容易出现丢包现象。为应对这些问题,可以在应用层实现重传机制、使用前向纠错码等方法。这些方法在一定程度上可以缓解UDP通信中的丢包问题,提高数据传输的可靠性和效率。
【Socket】解决UDP丢包问题的更多相关文章
- UDP丢包和无序 问题的解决方法
最近在做一个项目,在这之前,做了个验证程序. 发现客户端连续发来1000个1024字节的包,服务器端出现了丢包现象. 纠其原因,是服务端在还未完全处理掉数据,客户端已经数据发送完毕且关闭了. 我用过s ...
- 嵌入式开发之UDP 丢包--- UDP 丢包控制方法
0. 发送端可以,发送五次左右,再Sleep 1.调用recv方法接收端收到数据后,处理数据花了一些时间,处理完后再次调用recv方法,在这二次调用间隔里,发过来的包可能丢失.对于这种情况可以修改接收 ...
- udp丢包 处理
转自: 自己在做UDP传输时遇到的问题,接收端没设置缓存,结果总是丢包. 看到这篇文章设置了一下接收缓存就好 *;//设置为32K setsockopt(s,SOL_SOCKET,SO_RCVBUF, ...
- UDP丢包原因
一.主要丢包原因 1.接收端处理时间过长导致丢包:调用recv方法接收端收到数据后,处理数据花了一些时间,处理完后再次调用recv方法,在这二次调用间隔里,发过来的包可能丢失.对于这种情况可以修改接收 ...
- [转载]UDP丢包率提升
UDP丢包及无序问题 转载自:http://hi.baidu.com/gamedot/item/96cb9bf1a717eb14d6ff8cd5 最近在做一个项目,在这之前,做了个验证程序. 发现客户 ...
- 针对UDP丢包问题,进行系统层面和程序层面调优
转自:https://blog.csdn.net/xingzheouc/article/details/49946191 1. UDP概念 用户数据报协议(英语:User Datagram Proto ...
- TCP粘包, UDP丢包, nagle算法
一.TCP粘包 1. 什么时候考虑粘包 如果利用tcp每次发送数据,就与对方建立连接,然后双方发送完一段数据后,就关闭连接,这样就不会出现粘包问题(因为只有一种包结构,类似于http协议,UDP不会出 ...
- linux 系统 UDP 丢包问题分析思路
转自:http://cizixs.com/2018/01/13/linux-udp-packet-drop-debug?hmsr=toutiao.io&utm_medium=toutiao.i ...
- 我大概知道他在说什么了,是对内存单元的竞争访问吧。Python有GIL,在执行伪码时是原子的。但是伪码之间不保证原子性。 UDP丢包,你是不是做了盲发?没有拥塞控制的情况下,确实会出现丢包严重的情况。你先看看发送速率,还有是否带有拥塞控制。
我大概知道他在说什么了,是对内存单元的竞争访问吧.Python有GIL,在执行伪码时是原子的.但是伪码之间不保证原子性. UDP丢包,你是不是做了盲发?没有拥塞控制的情况下,确实会出现丢包严重的情 ...
- UDP丢包严重
项目要求udp能够达到10万的并发量,搞了几天,丢包严重, 今天终于解决了,原来是socket缓冲区设置的不够大已经jvm内存不够大
随机推荐
- eclipse 配置tomcat(更新了比较详细的版本)
eclipse 配置tomcat 打开eclipse,在上栏找到Window,点开找到preferences,点击,就有一个弹框出现 然后找到server,点开找到runtime environmen ...
- 力扣541(java)-反转字符串Ⅱ(简单)
题目: 给定一个字符串 s 和一个整数 k,从字符串开头算起,每计数至 2k 个字符,就反转这 2k 字符中的前 k 个字符. 如果剩余字符少于 k 个,则将剩余字符全部反转.如果剩余字符小于 2k ...
- 力扣349(java&python)-两个数组的交集(简单)
题目: 给定两个数组 nums1 和 nums2 ,返回 它们的交集 .输出结果中的每个元素一定是 唯一 的.我们可以 不考虑输出结果的顺序 . 示例 1: 输入:nums1 = [1,2,2,1], ...
- 力扣32(java)-最长有效括号(困难)
题目: 给你一个只包含 '(' 和 ')' 的字符串,找出最长有效(格式正确且连续)括号子串的长度. 示例 1: 输入:s = "(()"输出:2解释:最长有效括号子串是 &quo ...
- 【pytorch学习】之概率
6 概率 简单地说,机器学习就是做出预测.根据病人的临床病史,我们可能想预测他们在下一年心脏病发作的概率.在飞机喷气发动机的异常检测中,我们想要评估一组发动机读数为正常运行情况的概率有多大.在强化学习 ...
- 阿里云EMAS移动测试,帮您快速掌握移动端兼容性测试技巧
简介: 兼容性测试用于验证应用在不同设备上进行安装/启动/登录/不同版本覆盖安装/卸载等操作时,是否存在兼容性问题:如界面适配问题.应用性能等,现阿里云EMAS套餐免费试用,帮您快速掌握移动端兼容性测 ...
- 阿里云 MSE 支持 Go 语言流量防护
简介: OpenSergo 开源项目联合 Sentinel 项目,正在制定.完善限流降级标准,方便不同语言应用通过统一控制面来实现统一的微服务治理.阿里云微服务引擎(MSE)也会逐步支持 OpenSe ...
- IT人的年夜饭,也太香了吧
简介: 平时的IT人,奋战在修复bug前线,起早与贪黑齐飞,调休共假期待定.到了新春佳节,对于IT人来说,没有什么是比一顿年夜饭更让人熨贴肺腑的了.为了让废寝忘食编程序.闻机起早保运维的IT人过一个 ...
- dotnet 调试应用启动闪退的方法
应用程序如果启动即闪退,那大部分时候日志模块还没初始化完成,很难通过应用自身的启动流程了解到应用启动失败的原因.本文来告诉几个不同的方法用来调查应用启动失败的原因 应用启动失败的原因可能有很多,例如系 ...
- vue-公共组件的注册
注册公共组件,在每个需要的页面直接输入文件名(<g-table/>)即可引用该组件 步骤: 1.新建components/global文件夹,以及components/global/g-t ...