本文分享知识:

  1. pandas读取Excel数据 read_excel()
  2. 使用Python的加密库 hashlib
  3. pandas中map方法使用
  4. pandas写入Excel数据 to_excel()

项目源码地址:https://gitee.com/myrensheng/encryption

我这里有一份客户的Excel数据,里面有客户的手机号和身份证号信息,这些信息不能泄露,你加密一下发给我。

面对经理紧急安排的任务,小凡不敢懈怠,暂时放下手中正在处理的任务,将精力集中到数据加密这件事情上。

小凡思考了一会,数据加密,常用的加密算法有:md5和sha,既然没有要求,那就选择最简单的md5加密吧。

不一会,小凡脑海中就构思出了两种解决办法:

1、在Excel中调用md5加密函数,但这个需要安装加密文件,时间上可能来不及

2、用Python中的加密库,只需要读取Excel中的数据,再将加密好的数据导出为Excel即可

经过慎重的考虑,小凡决定使用Python进行数据加密。

一、用 pandas 读取 Excel 数据

import pandas as pd
# Excel文件
excel_path = "./test.xlsx"
# pandas读取Excel数据,并保存到 df 变量中
df = pd.read_excel(excel_path)
# 随机查看5条数据
df.sample(5)

read_excel() 常用参数:

io:excel文件地址

sheet_name:默认为第一个表格

header:头部(列名)从第几行开始,默认第一行

除了用pandas还可以用xlrd库读取Excel,xlwt将数据写入Excel,详情请看:第三章内容

二、加密库 hashlib

获取到数据后,开始加密。我们先学习一下如何使用加密库hashlib,加密一个客户的身份证号?

import hashlib
# 加密的字符串
string = "730763747019734357"
# 字符串进行 utf-8 编码
utf_8_str = str(string).encode("utf8")
# 调用 hashlib.md5() 方法进行加密
encry_result = hashlib.md5(utf_8_str).hexdigest()
encry_result
# 'f29e8eb231261735b849ad248ff50573'

这样就把一个字符串用 md5 的方法加密完成啦。让我们稍微修饰一下,编写一个加密的函数。

def encryption_str(string, encry_model="md5_32", encry_style=True):
# 加密为 utf-8 编码
utf_8_str = str(string).encode("utf8")
# 函数字典
param_dict = {
"md5_32": hashlib.md5(utf_8_str),
"md5_16": hashlib.md5(utf_8_str),
"sha1": hashlib.sha1(utf_8_str),
"sha224": hashlib.sha224(utf_8_str),
"sha256": hashlib.sha256(utf_8_str),
"sha512": hashlib.sha512(utf_8_str)
}
encry_result = param_dict[encry_model].hexdigest()
if encry_model == 'md5_16':
encry_result = encry_result[8:-8]
# 返回结果
return encry_result if encry_style == "小写" else encry_result.upper()

嗯,只是稍微修改一下。

三、 pandas中的 map() 方法

现在有1000多条数据,怎样才能将这么多的数据一次性加密完成呢?

这就需要用到 map() 方法:

pandas.series.map(arg,na_action=None),arg为一个函数,将series中的每一个数据作为arg函数的参数

经常与 lambda 函数连用,即:

df[“列名”].map(lambda x:func(x))

表示将该列的每一个数据 x,传递给 func(),并把函数的返回值组成新的列

df["手机号_md5"] = df["手机号"].map(lambda x:encryption_str(x))
df["身份证号_md5"] = df["身份证号"].map(lambda x:encryption_str(x))
df.sample(5)

数据已经加密完成啦,接下来就把数据重新保存为 Excel 发给经理。

pandas.DataFrame.to_excel() 常用参数:

sheet_name:工作表名,默认为 sheet1

index:是否输入索引,默认为 True

# 将数据保存到新的 excel 中
df.to_excel("./客户数据_md5加密.xlsx")

整个过程耗时15分钟,小凡检查了一下加密后的数据,确定没有问题,便将Excel发给经理。

见经理一直没有回消息,小凡继续做着先前的数据报告。

四、数据加密工具

过了一会,经理过来啦。

做的很好,能告诉我怎么做的吗?经理问。

小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。

有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。

没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?

小凡将自己如何用Python加密数据的步骤讲给经理听,但是经理好像听不太懂。

有没有什么工具,直接就将excel数据加密完成,不用写代码?经理期待的问到。

没有吧,网上的工具都只能加密一个字符串,没有直接加密excel文件的工具。不过,有什么是Python不能实现的呢?

于是,小凡决定用Python做个加密工具,这样操作起来就很方便啦。

用Python中的hashlib实现md5和sha加密的更多相关文章

  1. Java的单向加密算法MD5和SHA——加密和解密

    出自:http://www.cnblogs.com/onetwo/p/3875551.html 1.JDK中MD5和SHA加密的主要类 在JDK6.0中,与MD5与SHA密切相关的几个类的类图如下:  ...

  2. JAVA加密技术-----MD5 与SHA 加密

    关于JAVA的加密技术有很多很多,这里只介绍加密技术的两种 MD5与 SHA. MD5与SHA是单向加密算法,也就是说加密后不能解密. MD5 ---信息摘要算法,广泛用于加密与解密技术,常用于文件校 ...

  3. MD5和SHA加密实现

    @Test public void TestMD5AndSHA() throws NoSuchAlgorithmException { String MD5=Md5("123456" ...

  4. python中常用的base64 md5 aes des crc32等的加密解密

    1.base64 Python内置的base64模块可以实现base64.base32.base16.base85.urlsafe_base64的编码解码,python 3.x通常输入输出都是二进制形 ...

  5. 【Python】使用hashlib进行MD5和sha1摘要计算

    代码: import hashlib hash = hashlib.md5() hash.update('http://www.cnblogs.com/xiandedanteng'.encode('u ...

  6. Python中使用hashlib进行加密的简单使用

    import hashlib ''' 原文= '字符串' 哈希加密对象 = hashlib.加密算法( 原文.encode('utf-8') ) 密文 = 哈希加密对象.hexdigest() #密文 ...

  7. DES,AeS加解密,MD5,SHA加密

    1.DES一共就有4个参数参与运作:明文.密文.密钥.向量.其中这4者的关系可以理解为: 密文=明文+密钥+向量: 明文=密文-密钥-向量: 为什么要向量这个参数呢?因为如果有一篇文章,有几个词重复, ...

  8. MD5、sha加密

    MD5: 不可逆,一般用于密码的加密存储,数字签名,文件完整性验证 MD5码具有高度离散性,不可预测 MD5长度为128位,重复率几乎为0 易受密码分析的攻击 Sha: 对于长度小于2^64位的消息, ...

  9. python 模块之hashlib

    Hashlib模块 Python里面的hashlib模块提供了很多加密的算法,这里介绍一下hashlib的简单使用事例,用hashlib的md5算法加密数据,其他的所有加密算法使用方式上基本类似. h ...

  10. 加密算法中BASE64、MD5、SHA、HMAC等之间的区别

    http://blog.csdn.net/lplj717/article/details/51828692 根据项目需要了解了一下几种加密算法(参考其他博客),内容简要介绍BASE64.MD5.SHA ...

随机推荐

  1. 【DM论文阅读杂记】复杂社区网络

    Paper Title Community Structure in Time-Dependent, Multiscale, and Multiplex Networks Basic algorith ...

  2. css背景模糊化

    处理背景模糊化 在css中,可以利用filter属性和blur()函数实现高斯模糊效果,filter属性用于设置图片元素的可视效果,配合blur()函数使用可给图片元素添加高斯模糊效果,语法为&quo ...

  3. Java Maven环境搭建

    下载 Maven 官网地址: https://maven.apache.org/ 点击左侧的 "Download" 下载 Files 下面的 zip 文件 推荐使用迅雷进行下载,速 ...

  4. @Configuration 配置类打断点后,一启动项目读取到该配置类的话就会进断点

    @Configuration 配置类的话,打断点的时候,一启动项目就会读取配置信息,然后你在@Configuration 配置的类中打断点的话,一启动项目就会读取配置类,然后就会进断点,跟你平常的co ...

  5. parted创建硬盘分区并创建LVM

    基本分区创建分区只有那么大,无法调整大小,写入数据占满时便无法继续,而LVM特点就是可随意扩张大小,避免磁盘占满导致数据丢失. 查看磁盘lsblk 对磁盘进行分区  [root@localhost ~ ...

  6. 修改ubuntu 源

    查看源的类型,lsb_release -a Codename: jammy ?这里有可能是其他值. 找到同类型的源,修改:/etc/apt/sources.list

  7. chatgpt 的训练数据时间内容估计

    I noticed that the data you quoted is dated September 2021, but it's already 2023. I apologize for t ...

  8. python调用C库的方法

    主要介绍两种,一种是python的标准库内置的ctype,另一种是第三方的pybind11. 除此之外,还有其他的方案,例如,CFFI.Cython等等. 一.python的标准库ctype

  9. luna lunatic

    Luna是罗马神话的月神.英语中Lunacy.Lunatic等意指疯狂的字语源均来自Luna.月亮的阴晴圆缺影响地球的潮汐涨退甚至生物周期,故此古时的人们相信月亮拥有使人疯狂的魔力,人狼等传说亦是因此 ...

  10. 为什么手游选择lua热更新方案。

    https://www.zhihu.com/question/29603593 主要因为iOS系统的原因. 在这个知乎问题里,有两条回答,能解释我的疑惑.如下两个图. 我个人总结为,编译型语言(C#) ...