MD5算法学习整理

一路学来记得笔记不少但是给自己看当时就记得很随意以为后面都懂但还是太单纯了，现在回顾自己都完全看不下去，所以以后的都放的博客上，让自己看懂，让感兴趣的看懂，详细，暴力不废话了

MD5算法详解

　　　　0x01定义：网上很多啊

MD5算法是单向散列算法的一种。单向散列算法也称为HASH算法，是一种将任意长度的信息压缩至某一固定长度（称之为消息摘要）的函数(该压缩过程不可逆)

　　我们是对一个字符串进行MD5加密，所以我们先从字符串的处理开始。首先我们要知道一个字符的长度是8位（bit），即一个字节的长度。现在我们要做的就是将一个字符串Str1分割成每512位为一个分组，形如N*512+R，最后多出来的不足512位的R部分先填充一个1，再接无数个0，直到补足512位。这里要注意，R为0时也要补位，这时候补512位，最高位1，形如1000…00；如果R超出448，除了要补满这个分组外，还要再补上一个512位的分组（因为超过448位则不能留64位出来存放字符串的原长）。

　　接着，讲讲将字符串分块保存部分。一个512位的字符串分组要分成16个32位的子分组，在每个32位中，以字节为单位通过小端规则存入一个32位的变量中，可以考虑用int类型的变量（一个int变量32位），也可以考虑用unsigned int，这样之后涉及的循环移位就不用考虑符号位了，这里还是以int为例。因为一个字符就是一个字节（8位），所以一个int类型变量能存放4个字符，假设一个字符串abcd，那么存在一个int类型变量中就是dcba。因此这里我们将字符串每4个字符分成一块，每一个块都以小端规则存放在一个int类型的变量中。估计有的人为（N+1）*512位（如果R超出448，则是（N+2）*512），此时最低的64位预留，用来存放之前str1的长度length（长度为字符个数*8 bit）的值，如果这个length值的二进制位数大于64位，则只保留最低的64位。将这个64位的length放入之前填充好的str2的最后64位又要注意了：将length的64位分成2个32位，相当于2个字（1个字32位），再将这个2个字用类似小端规则排列，分别填入预留的64位。之前我就是这点没有领悟，估计大家也不是很懂.我具体说明一下：假设64位分成AB（A,B分别表示32位的二进制数，A是高位，B是低位），按小端规则排列后就是BA，将形如BA的64位按B（高位）到A（低位）的顺序填入str2预留的64位,而对A，B内部显示的每个字节则不用做处理。假设长度 0x12，则按A,B两个字来补位可以得：A=0x0000 0000，B=0x0000 0012。

　　　　　　　　至此，补位的思想已经讲完了，这里再讲讲我的具体实现。我的思路是用一个长度为16的int类型的数组int M[16]。因为一个int类型数据有32位，16个加起来刚好一共512位，是一个分组的长度。我刚好就按顺序M[0]…M[15]表示一个512位的数。我再声明一个容器vector，用来存放每个M[16]，因为分组个数不一定只有一个。
最后我举个例子方便大家理解。首先介绍一些常识：a – 61, b – 62, c – 63, d – 64, e – 65。这里“a – 61”表示a的ASCII码十六进制表示是0x61，其他以此类推。
好，假设一个字符串abcde，一共5个字符，长度length 为 5* 8 = 40 = 0x28。512位转化成十六进制就是64位。原字符串十六进制表示：61 62 63 64 65 00 00…00。完成补位后共512位，只有1个分组，形如： 61 62 63 64 65 80 00… 00（“80”的二进制是1000 0000，即之前的先补一个1，再补很多0的做法）。一个int M[16]的数组就够存了，即

M[] =    ，

M[] =    ，

M[] = ，

M[] =

…

M[] =    ，

M[] =

M[0]~M[15]设好之后，在内存中就是这样存的61 62 63 64 65 80 00…00（注意这里我们用MD5处理字符串时都考虑内存中的数据的排列顺序，得出的MD5也是需要按内存中的数据输出，所以经常要用小端规则转换）

　　　　看完这个例子，大家应该对0x01的内容有比较全面的了解了

0x02 MD5有四个32位的被称作链接变量的整数参数，

我们进行如下设置：

A=0x67452301，

B=0xefcdab89，

C=0x98badcfe，

D=0x10325476。

数据这样设置之后，存在内存中就按小端规则排列：01 23 45 67 89 ab cd ef …32 10
就是 0123456789 a到e再反过来储存的
再声明四个中间变量a,b,c,d，赋值：a = A, b = B, c = C, d = D。
接着再设置四个非线性函数：

　　　　F(X,Y,Z) =(X&Y)|((~X)&Z)

       G(X,Y,Z) =(X&Z)|(Y&(~Z))

       H(X,Y,Z) =X^Y^Z

       I(X,Y,Z)=Y^(X|(~Z))

（&是与，|是或，~是非，^是异或）
这四个函数的说明：如果X、Y和Z的对应位是独立和均匀的，那么结果的每一位也应是独立和均匀的。

假设M[j]表示消息的第j个子分组（从0到15），<<表示循环左移s，常数ti是4294967296*abs(sin(i))的整数部分，i取值从1到64，单位是弧度。(4294967296等于2的32次方)
//第一轮计算：j 从0 循环到15，轮数ln=0，i=j%16=j。
FF(a, b, c, d, M[j], s, ti)表示 a = b + ((a + F(b, c, d) + Mj + ti) <<< s)
// 第二轮计算：j 从0 循环到15, 轮数ln=1，i=(1+5*j)%16，使用循环函数G，
GG(a, b, c, d, M[j], s, ti)表示 a = b + ((a + G(b, c, d) + Mj + ti) <<< s)
//第三轮计算：j 从0 循环到15, 轮数ln=2，i=(5+3*j)%16，使用循环函数H
HH(a, b, c, d, M[j], s, ti)表示 a = b + ((a + H(b, c, d) + Mj + ti) <<< s)
//第四轮计算：j 从0 循环到15, 轮数ln=3，i=(7*j)%16，使用循环函数I，其他同第一轮
II(a, b, c, d, M[j], s, ti)表示 a = b + ((a + I(b, c, d) + Mj + ti) <<< s)
要确保形参a在内存中的值改变了，可以在形参中用按引用调用（&a），或返回a值取代原来a值。

0x03 主要循环

这个循环的循环次数为512位分组的个数（即之前提到的N+1或者N+2）。每次循环执行以下的步骤，我就不用文字表述了，直接用代码展示，相信大家能理解：

｛

a = A; b = B; c = C; d = D;

//传说中的对M[j]的第一轮循环

        FF(a,b,c,d,M[],(i),0xd76aa478 (ti));

        FF(d,a,b,c,M[],,0xe8c7b756);

        FF(c,d,a,b,M[],,0x242070db);

        FF(b,c,d,a,M[],,0xc1bdceee);

        FF(a,b,c,d,M[],,0xf57c0faf);

        FF(d,a,b,c,M[],,0x4787c62a);

        FF(c,d,a,b,M[],,0xa8304613);

        FF(b,c,d,a,M[],,0xfd469501) ;

        FF(a,b,c,d,M[],,0x698098d8) ;

        FF(d,a,b,c,M[],,0x8b44f7af) ;

        FF(c,d,a,b,M[],,0xffff5bb1) ;

        FF(b,c,d,a,M[],,0x895cd7be) ;

        FF(a,b,c,d,M[],,0x6b901122) ;

        FF(d,a,b,c,M[],,0xfd987193) ;

        FF(c,d,a,b,M[],,0xa679438e) ;

        FF(b,c,d,a,M[],,0x49b40821);

        //传说中对M[j]的第二轮循环

        GG(a,b,c,d,M[],,0xf61e2562);

        GG(d,a,b,c,M[],,0xc040b340);

        GG(c,d,a,b,M[],,0x265e5a51);

        GG(b,c,d,a,M[],,0xe9b6c7aa) ;

        GG(a,b,c,d,M[],,0xd62f105d) ;

        GG(d,a,b,c,M[],,0x02441453) ;//ti

        GG(c,d,a,b,M[],,0xd8a1e681);

        GG(b,c,d,a,M[],,0xe7d3fbc8) ;

        GG(a,b,c,d,M[],,0x21e1cde6) ;

        GG(d,a,b,c,M[],,0xc33707d6) ;

        GG(c,d,a,b,M[],,0xf4d50d87) ;

        GG(b,c,d,a,M[],,0x455a14ed);

        GG(a,b,c,d,M[],,0xa9e3e905);

        GG(d,a,b,c,M[],,0xfcefa3f8) ;

        GG(c,d,a,b,M[],,0x676f02d9) ;

        GG(b,c,d,a,M[],,0x8d2a4c8a);

        //传说中对M[j]的第三轮循环

        HH(a,b,c,d,M[],,0xfffa3942);

        HH(d,a,b,c,M[],,0x8771f681);

        HH(c,d,a,b,M[],,0x6d9d6122);

        HH(b,c,d,a,M[],,0xfde5380c) ;

        HH(a,b,c,d,M[],,0xa4beea44) ;

        HH(d,a,b,c,M[],,0x4bdecfa9) ;

        HH(c,d,a,b,M[],,0xf6bb4b60) ;

        HH(b,c,d,a,M[],,0xbebfbc70);

        HH(a,b,c,d,M[],,0x289b7ec6);

        HH(d,a,b,c,M[],,0xeaa127fa);

        HH(c,d,a,b,M[],,0xd4ef3085);

        HH(b,c,d,a,M[],,0x04881d05);

        HH(a,b,c,d,M[],,0xd9d4d039);

        HH(d,a,b,c,M[],,0xe6db99e5);

        HH(c,d,a,b,M[],,0x1fa27cf8) ;

        HH(b,c,d,a,M[],,0xc4ac5665);

        //传说中对M[j]的第四轮循环

        II(a,b,c,d,M[],,0xf4292244) ;

        II(d,a,b,c,M[],,0x432aff97) ;

        II(c,d,a,b,M[],,0xab9423a7);

        II(b,c,d,a,M[],,0xfc93a039) ;

        II(a,b,c,d,M[],,0x655b59c3) ;

        II(d,a,b,c,M[],,0x8f0ccc92) ;

        II(c,d,a,b,M[],,0xffeff47d);

        II(b,c,d,a,M[],,0x85845dd1) ;

        II(a,b,c,d,M[],,0x6fa87e4f) ;

        II(d,a,b,c,M[],,0xfe2ce6e0);

        II(c,d,a,b,M[],,0xa3014314) ;

        II(b,c,d,a,M[],,0x4e0811a1);

        II(a,b,c,d,M[],,0xf7537e82) ;

        II(d,a,b,c,M[],,0xbd3af235);

        II(c,d,a,b,M[],,0x2ad7d2bb);

        II(b,c,d,a,M[],,0xeb86d391);

        A += a;

        B += b;

        C += c;

        D += d;   //这是刚才强调的 把本轮运算的结果传递给下一轮 然后再次运算

所以md5的长度始终是128位

｝

0x04：处理完所有的512位的分组后，得到一组新的A,B,C,D的值，将这些值按ABCD的顺序级联，然后输出。这里还要注意，输出的MD5是按内存中数值的排列顺序，所以我们要分别对A,B,C,D的值做一个小端规则的转换。举个例子：A有32位，分成4个字节A1A2A3A4。输出A的时候，要这样输出：A4A3 A2A1。这样就能输出正确的MD5了。

想必能看到这都MD5还是有一定兴趣的奉上源码供调试研究

https://github.com/Arsense/WindowsCode

MD5算法学习整理的更多相关文章

KMP 算法学习整理
我自己整理的KMP算法的PDF文件:http://pan.baidu.com/s/1o8yKIi2提取密码:8291 别的就不多说啥了,感谢来自海子博客园的资料--
RMQ 算法学习整理
1. 概述 RMQ(Range Minimum/Maximum Query),即区间最值查询,是指这样一个问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A ...
python学习笔记（MD5算法）
博主最近进度停滞了对web开发理解欠缺好多内容今天整理下MD5算法,这个涉及到mysql数据库存储用户表密码字段的时候一般是带有加密的 # -*- coding: utf-8 -*- impor ...
MD5算法-爬虫学习（五）
在实现爬虫的时候,我们使用Hash结构去存储我们用过的URL的时候,有些URL可能长度很长,为了更加节省空间,我们就要对URL进行压缩,帮它减减肥,这个我们介绍这个MD5算法,可以对URL进行有效的压 ...
在MAC平台下编译Ngnix ，由于MD5算法不能编译通过解决办法
近期想学习Ngnix 代码,前些日子,对”自己下手狠一次“, 买了MAC 本. 所以想在Mac 上编译,是必须的,不然对不起自己的内心. 不巧遇到了MD5算法编译的问题 src/core/ngx_cr ...
信息摘要算法之一：MD5算法解析及实现
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于确保信息传输完整一致.是计算机广泛使用的杂凑算法之一(又译摘要算法.哈希算法),主流编程语言普遍已有MD5实现. ...
数据挖掘算法学习（八）Adaboost算法
本文不定期更新.原创文章,转载请附上链接http://blog.csdn.net/iemyxie/article/details/40423907 谢谢 Adaboost是一种迭代算法,其核心思想是针 ...
python常用算法学习（4）——数据结构
数据结构简介 1,数据结构数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成.简单来说,数据结构就是设计数据以何种方式组织并存贮在计算机中.比如:列表,集合与字 ...
MD5算法C/C++的实现
博客链接:http://blog.csdn.net/qq1084283172/article/details/52334027 在逆向程序的时候,经常会碰到加密的算法的问题,前面分析UC的逆向工程师的 ...

随机推荐

Web前端开发中的各种CSS规范
Reference: http://yusi123.com/2866.html 一.文件规范 1.文件均归档至约定的目录中(具体要求以豆瓣的CSS规范为例进行讲解): 所有的CSS分为两大类:通用类和 ...
java系列--MD5加密
方案一: /** * 1.对文本进行32位小写MD5加密 * @param plainText 要进行加密的文本 * @return 加密后的内容 */ public static String te ...
linux内核设计与实现笔记进程调度
转载:http://blog.chinaunix.net/uid-24919665-id-3013590.html
Angular - -ngKeydown/ngKeypress/ngKeyup 键盘事件和鼠标事件
ngKeydown/ngKeypress/ngKeyup 该指令在按键按下/按键按下/按键松开时执行指定表达式. ngKeydown和ngKeypress略有不同,目前的测试是ngKeypress针对 ...
才一年，H5的发展就成这样了......
关于H5的发展,分享几个最近看到的惊人数据和新闻: 1.截至2015,有80%的App将全部或部分基于HTML5.这意味着大部分App的内容都将是以网页的形式呈现,典型的例子包括微信.Facebook ...
JQuery flot API文档中文版
调用plot函数的方法如下: var plot = $.plot(placeholder, data, options) 其中placeholder可以是JQuery的对象,DOM元素或者JQuer ...
几种常用的控件（下拉框可选框起止日期在HTML页面直接读取当前时间）
下拉框 <div class="form-group"> <label class="col-xs-3 c ...
Webx3学习笔记(2)——基本流程
Webx3项目是运行在jetty/tomcat这种Web应用容器中的,Web应用的模式都是请求-响应的.一个请求通过浏览器发出,封装为HTTP报文到达服务端,被容器接受到,封装为HttpRequest ...
redhat6.4下安装Oracle11g
一.在Root用户下执行以下步骤: 1)修改用户的SHELL的限制,修改/etc/security/limits.conf文件 * soft nproc 2047 ...
Java NIO------基础理论之缓存区
1.概述:NIO我的理解就是 New IO,是API1.4里提供的新的API,为所有的原始类型做缓存支持. NIO主要的核心组成部分: Buffer(缓存) Channels(通道) Selector ...

MD5算法学习整理

MD5算法学习整理的更多相关文章

随机推荐

热门专题