RSA,Miller-Rabin素数测试的源流及其证明
一、RSA与公钥加密系统的起源与影响。
为了更好地突出公钥加密系统相对私钥加密系统的优势,让我们从这两个问题开始:
这个世界上如果没有公钥加密系统会怎么样呢?全用私钥加密系统会出现什么问题呢?
首先,私钥密码系统中的密码,加密解密之间是存在共享性的,也就是说,会加密就能做到会解密,会解密也就能做到会加密。
如果私钥密码系统用来做数字签名,会发生什么呢?你只要告诉了别人验证你的数字签名的正确性方法(解密),就同时告诉了他们伪造这个数字签名的方法(加密)。瞬间爆炸Orz。
其次,私钥加密系统需要有一次绝对保密的初始化过程。双方需要保密地交流一次约定加密方式。
在以往,这个过程都通过线下保证了保密。比如特工在出发前就跟总部约定好加密方式。
互联网时代这就出现问题了。如果你开了一个网站,需要跟每个用户进行保密交流。你很难跟每个用户都线下碰次头约定一下加密问题。可是如果交流全在网络上进行的话,双方约定加密方式的那几条信息本身用啥来加密呢。。。这就很尴尬了(ಡωಡ)
1977年,罗纳德·李维斯特(Ron Rivest)、阿迪·萨莫尔(Adi Shamir)和伦纳德·阿德曼(Leonard Adleman)(膜一发图灵奖Orz)将大数因式分解的不对称性与对密码系统不对称性的需求联系起来,创造了第一个公钥加密系统,RSA算法。迄今为止,2048位的RSA秘钥仍是非常安全的,在全世界被广泛使用。
(这种关联的能力或许就是创造力的核心源泉之一吧,我想,RSA如同蒙拉丽莎的微笑,“独钓寒江雪”的意境,都是人类巅峰创造力的结晶)
二、RSA的分析。
先直接奉上RSA加密流程
找两个不相同的素数p,q.设n=pq
取d,e使de=1+k(p-1)(q-1)成立
对于原文M(一个01串),加密方式为C=M^e mod n,C即为密文
解密方式为 N=C^d mod n
最后有 N ≡ M mod n
实际操作时n公开,e,d公开一个, q,p保密
正确性证明
N=C^d=M^ed=M^(1+k(p-1)(q-1))=M*M^k(p-1)(q-1)
因为p,q都是素数,由费马小定理:M^(p-1)≡1 (mod p) ,M^(q-1)≡1 (mod p)
得C≡M(mod p)
费马小定理是欧拉定理的特例,考虑到后面的需要,在这里直接证明欧拉定理及欧拉函数的一些性质:
另外由于d,e是对称的,d可以用来解密e发来的消息也可以用来加密只给e看的消息。
即加密方式C也可以为C=M^d mod n,解密方式为 N=C^e mod n

三、密钥的生成
怎么找到一个足够大的素数呢?
我自己的第一反应是筛法。。可是马上意识到如果能从遍历找q,p就能遍历破p,q。其次如果要遍历找高达2048位的素数即使计算机运算速度亿亿次每秒,也足够算到地老天荒。(粗略估算了下结果是个高达几百位的数字,单位年)
从而遍历的办法是肯定不行的。但联想欧拉函数在n充分大的时候趋近于n/lnn(即n非常大的时候小于n的素数个数大约为n/lnn,该命题已被证明但我不会证),我们可以知道2048位的数中素数的密度并不算很小,几千分之一的样子。
如果有一个算法可以判断出一个数是不是素数,再猜个几千次,我们就能得到想要的2048位的素数了。
于是引出另一个神奇的算法:Miller-Rabin算法(又出现了一个图灵奖的名字Orz)
Miller-Rabin算法的思想起源于对费马小定理的逆定理的研究。
费马小定理说,对一个素数p,对任意的小于p并大于1的自然数a有ap-1≡1 mod p。
那么如果一个数不满足上述性质,那它肯定是合数。并且绝大部分合数甚至只用a=2做判断便可以让其现形,在小于10000的数中,只有22个合数能逃过以2为底的判断(即只有22个数满足2n-1≡1 mod n,且n是合数)。这些数被称为基于2的伪素数(Fermat pseudoprime to base a)。以此类推还有以a=3为底的为素数,以n为底的伪素数。
看上去似乎费马小定理的逆定理是成立的,如果选取足够多的底,或许没有合数可以逃过判断。
但很遗憾的,并不是。1729 = 7×13×19就可以逃过所有判断,而它是合数。此外还有561,2465等(它们被统称为carmichael number)
这个最初的思想叫做费马素性检验,米勒(Miller)和拉宾(Rabin)改进了它,创造出了更加具有实用性的Miller-Rabin算法。
该算法源于这样一个结论,对于一个奇素数p,令p-1=2tu,其中t>=1且u是奇数。对i=0,1,2. t

xi形成的序列{x0,x1,..,xt}必为{1,1,1, ,1}或{x,y,z,____,-1,1,1,1,1}
原因很简单,如果p是素数,一个数mod p余1,那把它开平方自然有余1或-1.
以下证明Miller-Rabin测试对任何一个奇合数都能找到至少(n-1)/2个a使得生成的序列不满足上述结论(称这样的a为证据),包括carmichael number。
(参考文献:算法导论)


在实际测试中,并不会找出所有比待测数小的数字进行测试。因为2048位的整数实在太大了。但如果选取s个数进行测试,出错的概率至多为2-s。(即待测数明明是个合数,却测出来是个素数)。选1万个数测试就非常保险了。
综上,在寻找RSA密钥的过程中,利用素数密度为lnn/n的特点,知道了2048位整数中选几万奇数就极可能其中有素数。对这些数分别进行素数测试,如果选一万个数测试,每个数的出错概率为2的一万次幂分之一。几万个数总的出错概率非常非常低。于是找到了相当靠谱的2048位素数。
实际应用中似乎还有一些技巧用来使生成的素数更保险。但这不在我这篇文章的讨论范围里了。
以上。
RSA,Miller-Rabin素数测试的源流及其证明的更多相关文章
- POJ1811_Prime Test【Miller Rabin素数测试】【Pollar Rho整数分解】
Prime Test Time Limit: 6000MS Memory Limit: 65536K Total Submissions: 29193 Accepted: 7392 Case Time ...
- HDU1164_Eddy's research I【Miller Rabin素数测试】【Pollar Rho整数分解】
Eddy's research I Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others ...
- POJ2429_GCD & LCM Inverse【Miller Rabin素数測试】【Pollar Rho整数分解】
GCD & LCM Inverse Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 9756Accepted: 1819 ...
- POJ1811_Prime Test【Miller Rabin素数測试】【Pollar Rho整数分解】
Prime Test Time Limit: 6000MS Memory Limit: 65536K Total Submissions: 29193 Accepted: 7392 Case Time ...
- Miller Rabin素数检测与Pollard Rho算法
一些前置知识可以看一下我的联赛前数学知识 如何判断一个数是否为质数 方法一:试除法 扫描\(2\sim \sqrt{n}\)之间的所有整数,依次检查它们能否整除\(n\),若都不能整除,则\(n\)是 ...
- Miller Rabin素数检测
#include<iostream> #include<cstdio> #include<queue> #include<cstring> #inclu ...
- Miller Rabbin素数测试
步骤 ①先写快速幂取模函数 ②MR算法开始 (1)传入两个参数一个是底数一个是n也就是幂数,如果n是一个合数那么可以判定,这个数一定不是素数 (2)然后开始寻找一个奇数的n去计算,如果最后满足a^d% ...
- 关于素数:求不超过n的素数,素数的判定(Miller Rabin 测试)
关于素数的基本介绍请参考百度百科here和维基百科here的介绍 首先介绍几条关于素数的基本定理: 定理1:如果n不是素数,则n至少有一个( 1, sqrt(n) ]范围内的的因子 定理2:如果n不是 ...
- 与数论的厮守01:素数的测试——Miller Rabin
看一个数是否为质数,我们通常会用那个O(√N)的算法来做,那个算法叫试除法.然而当这个数非常大的时候,这个高增长率的时间复杂度就不够这个数跑了. 为了解决这个问题,我们先来看看费马小定理:若n为素数, ...
随机推荐
- 线程池与Threadlocal
线程池与Threadlocal 线程池: 线程池是为了使线程能够得到循环的利用,线程池里面养着一些线程,有任务需要使用线程的时候就往线程池里抓线程对象出来使用.线程池里的线程能够重复使用,所以在资源上 ...
- 【转载】DHCP流程
来源: http://network.51cto.com/art/201406/441752.htm DHCP是一个局域网的网络协议,使用UDP协议工作,主要有两个用途:给内部网络或网络服务供应商自动 ...
- if __name__ == '__main__' 如何正确理解
今天有个初学Python 的朋友问我这个问题,他说在网上好多回答他都不太理解.所以这里我来做说一下,希望能把这个问题说明白. 先举一个例子:假设我们有一个add.py文件,里面的代码是这样: def ...
- Java IO 之 BIO、NIO、AIO
1.BIO.NIO.AIO解释 Java BIO : 同步并阻塞 (Blocking IO) 一个连接一个线程 即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不 ...
- 漫谈格兰杰因果关系(Granger Causality)——第一章 野火烧不尽,春风吹又生
2017年7月9日上午6点10分,先师胡三清同志--新因果关系的提出者.植入式脑部电极癫痫治疗法的提出者.IEEE高级会员,因肺癌医治无效于杭州肿瘤医院去世,享年50岁.余蒙先师厚恩数载,一朝忽闻先师 ...
- Multimodal —— 看图说话(Image Caption)任务的论文笔记(三)引入视觉哨兵的自适应attention机制
在此前的两篇博客中所介绍的两个论文,分别介绍了encoder-decoder框架以及引入attention之后在Image Caption任务上的应用. 这篇博客所介绍的文章所考虑的是生成captio ...
- 【JQUERY】插件的写法
1. jquery插件怎么写 $.extend $.fn 2. 写的时候注意些什么
- 【D3】D3词汇表
按字母顺序 axis:数轴或坐标轴表示两个维度上数据尺度的直线 bar chart:条形图 (参见Excel)以矩形宽度反映数值大小的图表形式 bar:条形以宽度反映数值大小的矩形(rect) bin ...
- 面向对象设计——抽象工厂(Abstract Factory)模式
定义 提供一个创建一系列相关或者相互依赖对象的接口,而无需指定它们具体的类.抽象工厂允许客户使用抽象的接口来创建一组相关的产品,而不需要知道或关心实际产出的具体产品是什么.这样一来,客户就能从具体的产 ...
- LoadRunner性能测试-loadrunner工具破解
Loadrunner11破解 破解工具下载:http://pan.baidu.com/disk/home?errno=0&errmsg=Auth%20Login%20Sucess&&a ...