基于hashlib下的文件校验

hashlib不仅可以对密码进行加密也可以对文件内容进行校验，传统的小文件校验通过人为校验是不现实的，如果摸个文件里面的内容多出一个空格的话那么哦是根本就不知道的因此我们需要一个可以校验文件的方法，而hashlib则可以帮我们实现传统的文件校验

如下我们先试下普通的文件内容校验

代码如下

def check_md5(file):

    with open(file,mode="rb") as fp:

        hs = hashlib.md5()

        hs.update(fp.read())

    return hs.hexdigest()

res1 = check_md5("ceshi1.txt")

res2 = check_md5("ceshi2.txt")

print(res1,res2)

把两个文件的内容全部丢入hs.update（fp.read()）这个对象的方法中

调用hs.hexdigesst的话我会产生一个随机的32位字符串

此时如果两个文件的内容的如果是一模一样的话那么它所产生的随机32位字符串也是一样的这是实现文件校验的基本模型

上面我介绍了小文件的校验，现在我们得考虑一问题，文件的读取都是一股脑的全部丢到内存中进行读取的，那么如果一个文件是特别巨大的呢那时如果一股脑全部丢到内存中的话会直接把内存给挤爆了间接造成了内存的益出

下面我介绍两种方法读一点内容覆盖一点内容

注我们需要明白的是文件不仅是一个可迭代对象，同时也是一个迭代器

那么既然文件是一个迭代器对的话我就可以限制每次到文件中去取一定数值大小的文件进行update连续更新此时不会造成内存的直接爆炸又可以间接的对文件的内容进行校验

代码如下

def check_md5(file):

    hs = hashlib.md5()

    with open(file,mode="rb") as fp:

        while True:

            # 最多读取5个字节

            content = fp.read(5)

            if content:#如果content有值的话我就执行，没有值的话我就执行#else

                hs.update(content)

            else:

                break

    return hs.hexdigest()

print("<=======方法一=======>")

print(check_md5("ceshi1.txt"))

print(check_md5("ceshi2.txt"))

代码解析，我们要知道hashlib下的update是可以基于上一次的字符串大小更新完32位随机字符串之后继续累加更新的那么我每次从迭代器中取出一致大小的数据循环丢到update中进行持续的更新那么等我取完所有的文件之后所得到的的就是一个完整的32位随机字符串了与传统的文件读取所加密的随机字符串无区别

还有另外一个方法也可以循环的对文件的大小进行校验，重复累加之后所得到的字符创与上面是一致的

代码如下

def check_md5(file):

    hs = hashlib.md5()

    filesize = os.path.getsize(file)

    print(filesize)

    with open(file,mode="rb") as fp:

        while filesize:

            content = fp.read(10)

            hs.update(content)

            filesize -= len(content)

    return hs.hexdigest() 

print("<=======方法二=======>")

print(check_md5("ceshi1.txt"))

print(check_md5("ceshi2.txt"))

基于hashlib下的文件校验的更多相关文章

ubuntu 下的文件校验（md5、sha256）
在本地使用 md5sum/sha256sum 生成某待测文件的 hash 值,以跟标准文件的 hash 值做对比验证,确定经网络传输过程得到的文件是否真实无损.一般而言,hash 值如果一致,大概率上 ...
$Django 模板层(模板导入,继承)、单表*详(增删改查,基于双下划线的查询)、static之静态文件配置
0在python脚本中使用django环境 import osif __name__ == '__main__': os.environ.setdefault("DJANGO_SETT ...
使用hashlib进行文件校验
import hashlib import os path = r'D:\CentOS 64 位' def file_md5(path): """ 文件校验 :param ...
hashlib 文件校验，MD5动态加盐返回加密后字符
hashlib 文件校验 # for循环校验 import hashlib def check_md5(file): ret = hashlib.md5() with open(file, mode= ...
手把手写一个基于Spring Boot框架下的参数校验组件（JSR-303）
前言之前参与的新开放平台研发的过程中,由于不同的接口需要对不同的入参进行校验,这就涉及到通用参数的校验封装,如果不进行封装,那么写出来的校验代码将会风格不统一.校验工具类不一致.维护风险高等其它因素 ...
system32下 exe文件作用
system32下EXE文件的作用说明 A accwiz.exe 辅助功能向导 ahui.exe 应用程序兼容用户界面 alg.exe 为 Internet 连接共享和 Internet 连接防火墙提 ...
Hadoop IO 特性详解（2）【文件校验】
(本文引用了microheart,ggjucheng的一些资料,在此感谢.charles觉得知识无价,开源共享无价) 这一次我们接着分析文件IO校验的相关代码,看看最底层是如何实现这种大数据集的文件校 ...
Servlet3.0学习总结——基于Servlet3.0的文件上传
Servlet3.0学习总结(三)——基于Servlet3.0的文件上传在Servlet2.5中,我们要实现文件上传功能时,一般都需要借助第三方开源组件,例如Apache的commons-fileu ...
基于SpringMVC下的Rest服务框架搭建【1、集成Swagger】
基于SpringMVC下的Rest服务框架搭建[1.集成Swagger] 1.需求背景 SpringMVC本身就可以开发出基于rest风格的服务,通过简单的配置,即可快速开发出一个可供客户端调用的re ...

随机推荐

Hive性能调优（一）----文件存储格式及压缩方式选择
合理使用文件存储格式建表时,尽量使用 orc.parquet 这些列式存储格式,因为列式存储的表,每一列的数据在物理上是存储在一起的,Hive查询时会只遍历需要列数据,大大减少处理的数据量. 采用合 ...
ansible错误ImportError: No module named ansible.runner记录
按着官网提供的安装ansible To configure the PPA on your machine and install ansible run these commands: $ sudo ...
Web服务器—Apache
Apache配置文件:httpd.conf文件 # 指定Apache的安装路径,此选项参数值在安装Apache时系统会自动把Apache的路径写入. ServerRoot "/www/ser ...
yum / rpm 指令无反应
当yum 或者 rpm 指令执行后没有任何反馈,可尝试执行以下指令: # rm -f /var/lib/rpm/__db.00* # 删除rpm数据文件 # rpm –rebuilddb # 重建rp ...
C++踩坑——用memset对vector进行初始化
在一段程序中,使用memset对vector进行了初始化,然后得到了错误的结果.找这个bug花费了很长时间. vector中有其自身的结构,不能单纯的按字节进行初始化.使用memset对vector进 ...
02-webpack的基本配置-运行webpack
1安装webPack的方式第一次全局安装 npm i webpack -g 第一次安装了之后以后就不需要在安装了在项目根录中运行 npm i webpack --save-dev 安装到项目依赖中 ...
201271050130-滕江南-《面向对象程序设计（java）》第十四周学习总结
201271050130-滕江南-<面向对象程序设计(java)>第十四周学习总结项目内容这个作业属于哪个课程 <任课教师博客主页链接> https://www.cnbl ...
python的wraps函数
当使用@修饰符修饰函数时,会存在这样一个问题:被修饰的函数会消失(这是因为修饰函数没有设置返回值,如果设置了返回值,则就把返回值赋给被修饰函数,比如,test1函数的返回值设置为 return 6, ...
Spring Boot 中Bean的初始化后和销毁前的处理
Spring 对Bean的生命周期的操作提供了支持.具体实现又两种方式 1.使用@Bean 中的 initMethod 和 destroyMethod2.注解方式利用JSR-250 中的@PostC ...
Luogu P4068 [SDOI2016]数字配对
反正现在做题那么少就争取做一题写一题博客吧看到题目发现数字种类不多,而且结合价值的要求可以容易地想到使用费用流但是我们如果朴素地建图就会遇到一个问题,若$i,j$符合要求,那么给$i,j$ ...

基于hashlib下的文件校验

基于hashlib下的文件校验的更多相关文章

随机推荐

热门专题