hashlib不仅可以对密码进行加密也可以对文件内容进行校验,传统的小文件校验通过人为校验是不现实的,如果摸个文件里面的内容多出一个空格的话那么哦是根本就不知道的因此我们需要一个可以校验文件的方法,而hashlib则可以帮我们实现传统的文件校验

如下我们先试下普通的文件内容校验

代码如下

def check_md5(file):
with open(file,mode="rb") as fp:
hs = hashlib.md5()
hs.update(fp.read())
return hs.hexdigest() res1 = check_md5("ceshi1.txt")
res2 = check_md5("ceshi2.txt")
print(res1,res2)

把两个文件的内容全部丢入hs.update(fp.read())这个对象的方法中

调用hs.hexdigesst的话我会产生一个随机的32位字符串

此时如果两个文件的内容的如果是一模一样的话那么它所产生的随机32位字符串也是一样的这是实现文件校验的基本模型

上面我介绍了小文件的校验,现在我们得考虑一问题,文件的读取都是一股脑的全部丢到内存中进行读取的,那么如果一个文件是特别巨大的呢那时如果一股脑全部丢到内存中的话会直接把内存给挤爆了间接造成了内存的益出

下面我介绍两种方法读一点内容覆盖一点内容

注我们需要明白的是文件不仅是一个可迭代对象,同时也是一个迭代器

那么既然文件是一个迭代器对的话我就可以限制每次到文件中去取一定数值大小的文件进行update连续更新此时不会造成内存的直接爆炸又可以间接的对文件的内容进行校验

代码如下

def check_md5(file):
hs = hashlib.md5()
with open(file,mode="rb") as fp:
while True:
# 最多读取5个字节
content = fp.read(5)
if content:#如果content有值的话我就执行,没有值的话我就执行#else
hs.update(content)
else:
break
return hs.hexdigest() print("<=======方法一=======>")
print(check_md5("ceshi1.txt"))
print(check_md5("ceshi2.txt"))

代码解析,我们要知道hashlib下的update是可以基于上一次的字符串大小更新完32位随机字符串之后继续累加更新的那么我每次从迭代器中取出一致大小的数据循环丢到update中进行持续的更新那么等我取完所有的文件之后所得到的的就是一个完整的32位随机字符串了与传统的文件读取所加密的随机字符串无区别

还有另外一个方法也可以循环的对文件的大小进行校验,重复累加之后所得到的字符创与上面是一致的

代码如下

def check_md5(file):
hs = hashlib.md5()
filesize = os.path.getsize(file)
print(filesize)
with open(file,mode="rb") as fp:
while filesize:
content = fp.read(10)
hs.update(content)
filesize -= len(content)
return hs.hexdigest() print("<=======方法二=======>")
print(check_md5("ceshi1.txt"))
print(check_md5("ceshi2.txt"))

基于hashlib下的文件校验的更多相关文章

  1. ubuntu 下的文件校验(md5、sha256)

    在本地使用 md5sum/sha256sum 生成某待测文件的 hash 值,以跟标准文件的 hash 值做对比验证,确定经网络传输过程得到的文件是否真实无损.一般而言,hash 值如果一致,大概率上 ...

  2. $Django 模板层(模板导入,继承)、 单表*详(增删改查,基于双下划线的查询)、static之静态文件配置

    0在python脚本中使用django环境 import osif __name__ == '__main__':    os.environ.setdefault("DJANGO_SETT ...

  3. 使用hashlib进行文件校验

    import hashlib import os path = r'D:\CentOS 64 位' def file_md5(path): """ 文件校验 :param ...

  4. hashlib 文件校验,MD5动态加盐返回加密后字符

    hashlib 文件校验 # for循环校验 import hashlib def check_md5(file): ret = hashlib.md5() with open(file, mode= ...

  5. 手把手写一个基于Spring Boot框架下的参数校验组件(JSR-303)

    前言 之前参与的新开放平台研发的过程中,由于不同的接口需要对不同的入参进行校验,这就涉及到通用参数的校验封装,如果不进行封装,那么写出来的校验代码将会风格不统一.校验工具类不一致.维护风险高等其它因素 ...

  6. system32下 exe文件作用

    system32下EXE文件的作用说明 A accwiz.exe 辅助功能向导 ahui.exe 应用程序兼容用户界面 alg.exe 为 Internet 连接共享和 Internet 连接防火墙提 ...

  7. Hadoop IO 特性详解(2)【文件校验】

    (本文引用了microheart,ggjucheng的一些资料,在此感谢.charles觉得知识无价,开源共享无价) 这一次我们接着分析文件IO校验的相关代码,看看最底层是如何实现这种大数据集的文件校 ...

  8. Servlet3.0学习总结——基于Servlet3.0的文件上传

    Servlet3.0学习总结(三)——基于Servlet3.0的文件上传 在Servlet2.5中,我们要实现文件上传功能时,一般都需要借助第三方开源组件,例如Apache的commons-fileu ...

  9. 基于SpringMVC下的Rest服务框架搭建【1、集成Swagger】

    基于SpringMVC下的Rest服务框架搭建[1.集成Swagger] 1.需求背景 SpringMVC本身就可以开发出基于rest风格的服务,通过简单的配置,即可快速开发出一个可供客户端调用的re ...

随机推荐

  1. 比hive快10倍的大数据查询利器presto部署

    目前最流行的大数据查询引擎非hive莫属,它是基于MR的类SQL查询工具,会把输入的查询SQL解释为MapReduce,能极大的降低使用大数据查询的门槛, 让一般的业务人员也可以直接对大数据进行查询. ...

  2. 无法打开“Visual Studio Code”,因为Apple无法检查其是否包含恶意软件。”的问题解决

    解决方法: 1.系统偏好设置==> 安全性与隐私 ===> 在下方允许就可以了. 2.一劳永逸 但是注意安全性 打开terminal 命令行工具输入命令:sudo spctl --mast ...

  3. Shell命令-网络操作之基础之scp、wget

    文件及内容处理 - scp.wget 1. scp:用于不同主机之间复制文件 scp命令的功能说明 scp 命令用于 Linux 之间复制文件和目录.scp 是 secure copy 的缩写, sc ...

  4. 四,专著研读(K-近邻算法)

    四,专著研读(K-近邻算法) K-近邻算法有监督学习距离类模型, k-近邻算法步骤 计算已知类别数据集中的点与当前点之间的距离 按照距离递增的次序进行排序 选取与当前点距离最小的K个点 确定前k个点出 ...

  5. 访问https问题

    访问https问题 package com.yuantiao.smartcardms.tools; import com.alibaba.fastjson.JSONObject; import com ...

  6. 《为什么说Redis是单线程的以及Redis为什么这么快!》

    为什么说Redis是单线程的以及Redis为什么这么快!   一.前言 近乎所有与Java相关的面试都会问到缓存的问题,基础一点的会问到什么是“二八定律”.什么是“热数据和冷数据”,复杂一点的会问到缓 ...

  7. 《阿里B2B技术架构演进详解》----阅读

    B2B(Business To Business)是指一个市场的领域的一种,是企业对企业之间的营销关系.先来总结一下阿里B2B共分为三个阶段: 第一阶段,建立信息网站提供信息和营销服务平台,让买家更加 ...

  8. Ultimate Chicken Horse GameProject第三次迭代成果文档

    经过三次迭代我们实现了游戏的基本功能 项目文档的github链接:https://github.com/k6tok12355/Ultimate-Chicken-Horse 下面是我们在第一次迭代中设定 ...

  9. CSS选择器[attribute | = value] 和 [attribute ^ = value]的区别

    前言 首先你需要知道[attribute | = value] 和 [attribute ^ = value] 分别是什么? ①:[attribute | = value] ②:[attribute ...

  10. 【大数据】SparkSql 连接查询中的谓词下推处理 (二)

    本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/II48YxGfoursKVvdAXYbVg作者:李勇 目录:1.左表 join 后条件下推2.左表j ...