【python】-- Socket粘包问题 ,解决粘包的几种方法、socket文件下载,md5值检验
上一篇随笔:“socket 接收大数据”,在win系统上能够运行,并且解决了大数据量的数据传输出现的问题,但是运行在linux系统上就会出现如下图所示的情况:

就是服务端两次发送给客户端的数据(第一次发送是时准备发送数据的字节大小,第二次是数据内容)粘在一起了,这是socket中的粘包:
查看服务端代码就能知道发生粘包的原因:
import socket,os server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(500)
if not data:
print("客户端已经断开")
break
print("执行指令:",data.decode())
cmd_res = os.popen(data.decode()).read()
print("发送文件大小", len(cmd_res))
print("send before")
if len(cmd_res) == 0:
cmd_res = "cmd has no output......"
#合成下面两次手动send,将数据大小和数据内容合一次发送给客户端,所以导致数据粘在一起了
conn.send(str(len(cmd_res)).encode())
conn.send(cmd_res.encode())
print("send done")
server.close()
解决大数据传输过程中的粘包:
1、sleep
sleep一下这个样子就可以使缓冲区超时,就不在等下一次的了,这样就可以和下一条命令隔离开(不过这样会降低代码性能,不建议使用)
import socket,os server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(500)
if not data:
print("客户端已经断开")
break
print("执行指令:",data.decode())
cmd_res = os.popen(data.decode()).read()
print("发送文件大小", len(cmd_res))
print("send before")
if len(cmd_res) == 0:
cmd_res = "cmd has no output......"
conn.send(str(len(cmd_res)).encode())
#在两次发送之间sleep一下
sleep(0.5)
conn.send(cmd_res.encode())
print("send done")
server.close()
2、客户端、服务端之间插入交互解决粘包问题
在服务端来一个等待客户端确认,就ok了,这个确认不需要用户输入,而是客户端自动的给你来这个响应,就是说,客户端自动的写好代码,自动的给服务器一个响应,只要收到服务端的数据大小,我就立刻给服务器一个响应,就是在第一次send和第二次send之前插入一个交互,就能把数据分开了
服务端:
import socket,os server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(500)
if not data:
print("客户端已经断开")
break
print("执行指令:",data.decode())
cmd_res = os.popen(data.decode()).read()
print("发送文件大小", len(cmd_res))
print("send before")
if len(cmd_res) == 0:
cmd_res = "cmd has no output......"
conn.send(str(len(cmd_res)).encode()) # 数据大小
#等待客户端确认
client_acknowledge = server.recv(1024)
conn.send(cmd_res.encode()) # 数据内容
print("send done")
server.close()
客户端:
import socket
client = socket.socket()
client.connect(("localhost", 2222))
while True:
cmd = input(">>:").strip()
if len(cmd) == 0:continue
client.send(cmd.encode("utf-8"))
cmd_res_size = client.recv(500)
# 发个响应给服务端,告诉服务端,客户端已经准备好了
print("即将接收数据大小:", cmd_res_size.decode())
client.send("客户端准备好接收数据内容了".encode())
recevied_size = 0
recevied_data = b""
while recevied_size < int(cmd_res_size.decode()):
cmd_res = client.recv(500)
recevied_size += len(cmd_res)
recevied_data += cmd_res
else:
print(recevied_data.decode())
print("cmd res receive done ....", recevied_size)
client.close()
socket 文件下载
1、简单FTP:
上传下载是FTP最基本的功能,现在来模拟一下FTP的文件下载功能
服务端:
获取命令和文件名->判断文件是否存在->打开文件->获取文件大小->发送文件大小给客户端->等待客户端确认->边读边发
import socket,os server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(1024)
if not data:
print("客户端已经断开")
break
cmd, file_name = data.decode().split() # 接收客户端发过来的命令和文件名
print("执行指令:%s, 文件名:%s" % (cmd, file_name))
if os.path.isfile(file_name):
with open(file_name, "rb") as f:
file_size = os.stat(file_name).st_size # 获取一个文件的大小:os.stat(文件名).st_size
conn.send(str(file_size).encode())
conn.recv(1024) # 等待客户端确认,防止发生粘包
for line in f:
conn.send(line)
print("send done")
server.close()
客户端:
判断是否是下载命令(get) ->发送下载命令和文件名 ->获取文件大小->发送确认信息->判断时候已经全部接收
import socket
client = socket.socket()
client.connect(("localhost", 2222))
while True:
cmd = input(">>:").strip()
if len(cmd) == 0:continue
print(cmd)
if cmd.startswith("get"):
client.send(cmd.encode("utf-8")) # 发送下载命令和文件名
cmd_res_size = client.recv(1024) # 接收文件大小
print("即将接收数据大小:", cmd_res_size.decode())
client.send("客户端准备好接收数据内容了".encode())
recevied_size = 0
recevied_data = b""
file_name = cmd.split()[1] # 文件名
with open(file_name + "_new", "wb",) as f:
while recevied_size < int(cmd_res_size.decode()):
cmd_res = client.recv(500)
recevied_size += len(cmd_res)
f.write(cmd_res)
else:
print(recevied_data.decode())
print("cmd res receive done ....", recevied_size)
client.close()
2、MD5值校验:
上面代码实现了FTP文件的下载的功能,可是就一定能够保证客户端下载的文件跟服务端发送的文件一致?为了解决这个问题可以用到MD5值进行校验,从而判断客户端和服务端的一致性!
服务端:
import socket, os, hashlib server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(1024)
if not data:
print("客户端已经断开")
break
cmd, file_name = data.decode().split() # 接收客户端发过来的命令和文件名
print("执行指令:%s, 文件名:%s" % (cmd, file_name))
if os.path.isfile(file_name):
m = hashlib.md5() # 生成MD5对象
with open(file_name, "rb") as f:
file_size = os.stat(file_name).st_size # 获取一个文件的大小:os.stat(文件名).st_size
conn.send(str(file_size).encode())
conn.recv(1024) # 等待客户端确认,防止发生粘包
for line in f:
m.update(line) # 不断更新计算MD5值
conn.send(line)
print("md5值", m.hexdigest())
conn.recv(1024) # 等待客户端确认,防止发生粘包,准备发送MD5值
conn.send(m.hexdigest().encode()) # 发送MD5值给客户端
print("send done")
server.close()
客户端:
import socket, hashlib
client = socket.socket()
client.connect(("localhost", 2222))
while True:
cmd = input(">>:").strip()
if len(cmd) == 0:continue
print(cmd)
if cmd.startswith("get"):
client.send(cmd.encode("utf-8")) # 发送下载命令和文件名
file_size = client.recv(1024) # 接收文件大小
print("即将接收数据大小:", file_size.decode())
client.send("客户端准备好接收数据内容了".encode())
revived_size = 0
file_name = cmd.split()[1] # 文件名
m = hashlib.md5() # 生成MD5对象
with open(file_name + "_new", "wb",) as f:
while revived_size < int(file_size.decode()):
cmd_res = client.recv(500)
revived_size += len(cmd_res)
m.update(cmd_res) # 不断更新计算接收数据的文件值
f.write(cmd_res)
else:
print(file_size, revived_size)
client_md5_value = m.hexdigest() # 生成接收数据的MD5值16进制形式
client.send("ready to revived file md5 value".encode())
server_md5_value = client.recv(1024) # 接收服务端的MD5值
print("client接收文件MD5值:%s,server发送文件的MD5值:%s" % (client_md5_value,server_md5_value))
if client_md5_value == server_md5_value.decode(): # 客户端和服务端的MD5值做比较
print("file revived done")
else:
print(client_md5_value, server_md5_value.decode())
client.close()
3、解决粘包方式改进:
上面的代码用MD5来校验还是用的之前解决粘包的方法,就是客户端发送一个请求,等待服务端的确认的这样的方式。下面用另外一种方法:就是客户端已经知道可接收多少数据了,既然客户端已经知道接收多少数据了,那么客户端在接收数据的时候,正好接收已经知道的数据,多余的数据就不接收了,就是说我循环接收了已知数据大小的文件。比如:服务端要发6100字节的数据,客户端正好收到6000字节的数据,然后就不往下再收了(因为在接收,就有可能跟MD5值黏在一块了,如果客户端正好接收6000字节的话,剩下的100字节就不收了,客户端把6000字节的文件保存后,再来revived一下,下面revived的正好是100字节,这100字节就是MD5值)
服务端:
import socket, os, hashlib server = socket.socket()
server.bind(('localhost',2222)) server.listen() while True:
conn,addr = server.accept()
print("一个新的连接:",addr)
while True:
print("等待新指令")
data = conn.recv(1024)
if not data:
print("客户端已经断开")
break
cmd, file_name = data.decode().split() # 接收客户端发过来的命令和文件名
print("执行指令:%s, 文件名:%s" % (cmd, file_name))
if os.path.isfile(file_name):
m = hashlib.md5() # 生成MD5对象
with open(file_name, "rb") as f:
file_size = os.stat(file_name).st_size # 获取一个文件的大小:os.stat(文件名).st_size
conn.send(str(file_size).encode()) # 发送文件大小
conn.recv(1024) # 等待客户端确认,防止发生粘包
for line in f:
m.update(line) # 不断更新计算MD5值
conn.send(line)
print("md5值", m.hexdigest())
conn.send(m.hexdigest().encode()) # 发送MD5值给客户端
print("send done")
server.close()
客户端:
import socket, hashlib
client = socket.socket()
client.connect(("localhost", 2222))
while True:
cmd = input(">>:").strip()
if len(cmd) == 0:continue
print(cmd)
if cmd.startswith("get"):
client.send(cmd.encode("utf-8")) # 发送下载命令和文件名
file_size = client.recv(1024) # 接收文件大小
print("即将接收数据大小:", file_size.decode())
client.send("客户端准备好接收数据内容了".encode())
revived_size = 0
file_name = cmd.split()[1] # 文件名
m = hashlib.md5() # 生成MD5对象
with open(file_name + "_new", "wb",) as f:
while revived_size < int(file_size.decode()):
if int(file_size.decode()) - revived_size > 1024: # 只要剩余文件字节大于1024字节,就默认最大值接收
size = 1024
else:
size = int(file_size.decode()) - revived_size # 最后一次,剩多少收多少
print("last receive:", size)
file_data = client.recv(size)
revived_size += len(file_data)
m.update(file_data) # 不断更新计算接收数据的文件值
f.write(file_data)
else:
print(file_size, revived_size)
client_md5_value = m.hexdigest() # 生成接收数据的MD5值16进制形式
server_md5_value = client.recv(1024) # 接收服务端的MD5值
print("client接收文件MD5值:%s,server发送文件的MD5值:%s" % (client_md5_value, server_md5_value))
client.close()
【python】-- Socket粘包问题 ,解决粘包的几种方法、socket文件下载,md5值检验的更多相关文章
- tcp粘包、解决粘包问题
目录 subproess模块 TCP粘包问题 粘包两种情况 解决粘包问题 struct模块的使用 使用struct模块解决粘包 优化解决粘包问题 上传大文件 服务端 客户端 UDP协议 upd套接字 ...
- python全栈开发day28-网络编程之粘包、解决粘包,上传和下载的作业
一.昨日内容回顾 1. tcp和udp编码 2. 自定义mysocket解决编码问题 二.今日内容总结 1.粘包 1)产生粘包原因: (1).接收方不知道消息之间的边界,不知道一次性要取多少字节的数据 ...
- 8-2udp和tcp网络编程以及粘包和解决粘包的方法
一 tcp网络编程 server 端 import socket sk=socket.socket() #实例化一个对象 sk.setsockopt(socket.SOL_SOCKET,socket ...
- vue开发环境和生产环境里面解决跨域的几种方法
什么是跨域 跨域指浏览器不允许当前页面的所在的源去请求另一个源的数据.源指协议,端口,域名.只要这个3个中有一个不同就是跨域. 这里列举一个经典的列子: #协议跨域 http://a.baidu. ...
- python多进程编程中常常能用到的几种方法
python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU资源,在python中大部分情况需要使用多进程.python提供了非常好用的多进程包Multiprocessing,只需要定义 ...
- 【机器学习算法-python实现】协同过滤(cf)的三种方法实现
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景 协同过滤(collaborative filtering)是推荐系统经常使用的一种方法.c ...
- js常用代码示例及解决跨域的几种方法
1.阻止默认行为 // 原生js document.getElementById('btn').addEventListener('click', function (event) { event = ...
- java war包 路径--解决war包中文件路径问题
https://blog.csdn.net/u013409283/article/details/51480948 转自:http://free-chenwei.iteye.com/blog/1507 ...
- Appium Android 获取包名appPackage和appActivity的几种方法
情况1: 安装包未安装到手机 准备前提条件: 1 Android SDK管理工具目录 2 PC端有apk包 使用方法: 1 打开终端,当前路径移动到sdk管理工具目录tools或build-tools ...
随机推荐
- 介绍下Shell中的${}、##和%%使用范例
假设定义了一个变量为:代码如下:file=/dir1/dir2/dir3/my.file.txt可以用${ }分别替换得到不同的值:${file#*/}:删掉第一个 / 及其左边的字符串:dir1/d ...
- zookeeper安装和使用
Zookeeper是Hadoop的一个子项目,它是分布式系统中的协调系统,可提供的服务主要有:配置服务.名字服务.分布式同步.组服务等. 1.下载地址 https://mirrors.cnnic.cn ...
- 为windows开启winrm service, 以便进行远程管理
为windows开启winrm service, 以便进行远程管理 是windows 一种方便远程管理的服务:开启winrm service,便于在日常工作中,远程管理服务器,或通过脚本,同时管理 ...
- 三分钟教你学Git(十三) - 二分查找
比方说你收到了错误报告,然后你知道前几天明明是好的.可是这几天有好多新的commit被部署了.那么我们怎么迅速的找到第一个引入Bug的commit呢? 我们能够使用git bisect,git利用二分 ...
- MySQL日期函数的用法几则
1.将Date类型变成年月日时分秒的形式 select date_format(claimDate,'%Y-%m-%d %H:%i:%s') as claimdate from t1 2.只要年月日的 ...
- C++11之右值引用(一):从左值右值到右值引用
C++98中规定了左值和右值的概念,但是一般程序员不需要理解的过于深入,因为对于C++98,左值和右值的划分一般用处不大,但是到了C++11,它的重要性开始显现出来. C++98标准明确规定: 左值是 ...
- springboot @Configuration
有了@Configuration,原来的springBean的配置文件可以去掉了, 原来在application.xml中配置的bean可以配置在@Configuration注解的来类中,使用@Bea ...
- 重启nginx后丢失nginx.pid的解决方法(转)
一,nginx的停止操作 停止操作是通过向nginx进程发送信号来实现的.步骤1:查询nginx主进程号 ps -ef | grep nginx 在进程列表里 面找master进程,它的编号就是主进程 ...
- javascript---》arguments对象
使用arguments可以直接访问函数传入的实参 如:arguments[0]访问第一个参数,arguments[1]访问第二个参数 arguments.length检测函数的参数个数 如: func ...
- 【SpringMVC学习10】SpringMVC对RESTfull的支持
RESTful架构,就是目前流行的一种互联网软件架构.它结构清晰.符合标准.易于理解.扩展方便,所以正得到越来越多网站的采用.RESTful架构对url进行规范,写RESTful格式的url是什么样子 ...