【C/C++】随机数问题
最初问题:从n个数中随机选择m个数(0<=m<=n)。
为了便于描述,可以将该问题抽象为:从0-n-1这n个数中随机选择m个数。计算机能够提供的随机数都是伪随机的,我们假设计算机提供的伪随机数为真正的随机。
0、产生一个随机数
系统(c/c++)提供的rand函数只有15位,如果不满足要求,需要自己扩展,30位的随机函数如下:
- /** @brief 返回一个30bit的随机数
- ** @note 系统自带的rand只有15bit
- */
- int BigRand()
- {
- static bool flag=false;
- if(flag==false)
- {
- srand(time(0));
- flag = true;
- }
- return (rand()<<15)+rand();
- }
1、最简单的解法
每次产生一个0-n-1之间的随机数,放入一个集合中,直到集合的大小为m。C++的STL中有set,比较方便:
- void GetRandNum_set(int m,int n)
- {
- cout<<__FUNCTION__<<": ";
- set<int> s;
- while(signed(s.size())<m)
- {
- s.insert(RandInt(0,n-1));
- }
- set<int>::iterator i=s.begin();
- while(i!=s.end())
- cout<<*i++<<" ";
- cout<<endl;
- }
上面的代码工作没有问题,但是当m接近n且很大时,最后几个数的产生将会很困难。因为会生成大量的重复的数。
如何不产生重复的数呢?
2、最多n次的解法
假设当前剩余m个数要选,
从0开始到n-1这n个数,以m/n的概率选中选中0:总共n个数,要选出m个;
对于1:如果选中0,则以(m-1)/(n-1)的概率选择1(总共n-1个,要选m-1个);如果没选中,则以m/(n-1)的概率选(总共n-1个,要选m个);
……
对于i:总共还剩下n-i个,还需要选m个,那么选中的概率就是m/(n-i)。
没选中一个,剩余要选的数就减少一个。
因此代码如下:
- /** @brief 在[0-n)中随机的选择m个不同的数
- ** 并按序输出
- */
- void GetRandNumSorted(int m,int n)
- {
- cout<<__FUNCTION__<<": ";
- if(m<0 || m>=n) return;
- for(int i=0; m!=0 && i<n; i++)
- {
- if(BigRand()%(n-i)<m)
- {
- cout<<i<<" ";
- m--;
- }
- }
- cout<<endl;
- }
显然,这时输出是从小到大按序选择的。
其中:if(BigRand()%(n-i)<m) 的概率为:m/(n-i)。
可以分析,每个数选中的概率都是m/n:
数 选中概率
0: m/n
1: m/n * (m-1)/(n-1) + (1-m/n) * m/(n-1) =m/n;
2: 好多项相加,这里就不写了。。。
……
3、不按序输出
如果要求不按序输出,有两种解决办法。
一种是将上面的结果保存起来,然后再打乱保存的数组。
还有一种就是直接产生m个随机数。
先看直接产生m个随机数,其实就是先从0-n-1中随机选择一个,作为第一个;然后再从剩下的n-1个数中随机选择一个作为第二个……直到选出第m个。这就是所谓“完美洗牌”或者打乱数组。
- /** @brief 在[0-n)中随机的选择m个不同的数
- ** 并随机输出
- */
- void GetRandNum(int m, int n)
- {
- cout<<__FUNCTION__<<": ";
- int * p= (int*)malloc(sizeof(int)*n);//!!!
- for(int i=0;i<n;i++)
- p[i] = i;
- ///shuffle p[0...m-1]
- for(int i=0; i<m; i++)
- {
- swap(p[i],p[RandInt(i,n-1)]);
- cout<<p[i]<<" ";
- }
- cout<<endl;
- free(p);
- }
这里需要一个函数,能够随机产生一定范围内的数:
- /** @brief 返回[l,u]之间的一个随机数 **/
- int RandInt(int l, int u)
- {
- l = l<u?l:u;
- u = l<u?u:l;
- return BigRand()%(u-l+1) + l;
- }
这种算法的问题是,如果n很大,m很小,对辅助空间的浪费太严重。因为开辟了那么大的空间,实质只用了很少一部分。
另一种就是先按序随机选择m个数,然后再打乱:
- /** @brief 在[0-n)中随机的选择m个不同的数
- ** 并随机输出
- */
- void GetRandNum2(int m, int n)
- {
- cout<<__FUNCTION__<<": ";
- int * p= (int*)malloc(sizeof(int)*m);
- int tm=m;
- for(int i=0,j=0; m!=0 && i<n; i++)
- {
- if(BigRand()%(n-i)<m)
- {
- p[j++]=i;//cout<<i<<" ";
- m--;
- }
- }
- for(int i=0; i<tm; i++)
- {
- swap(p[i],p[RandInt(i,tm-1)]);
- cout<<p[i]<<" ";
- }
- cout<<endl;
- free(p);
- }
4、随机读取文件中的一行
在不知道文件总行数的情况下,随机读取文件中的一行。
最直观的做法就是,先读取一次文件,确定总行数n。然后产生一个1-n的随机数m,再读取第m行。显然这是可行的,但是问题是如果文件很大,平均要遍历文件1.5次。效率很低。
而且如果文件在不算增长,那么这个方法就不行了。
通过上面的算法的启发,其实也可以只读取一次。
首先读取第一行,如果只有一行,就结束了,设为line;
如果有第2行,那么以1/2的概率替换line;这时1、2两行被选中的概率都是1/2.
如果有第3行,那么以1/3的概率替line;则第3行被选中的概率是1/3,1、2两行被选中的概率则都是1/2*2/3=1/3.
……
第i行,以1/i的概率替换line。
直到文件结束。
- /** @brief 从文件fname中随机读取一行 */
- void GetOneLineRand(const char *fname)
- {
- cout<<__FUNCTION__<<": ";
- string line,str_save;
- ifstream ins(fname);
- int cnt=1;
- while(getline(ins,line))
- {
- if(cnt==1)
- {
- str_save = line;
- }
- else
- {
- if(RandInt(1,cnt)==1)///[1,cnt]
- str_save = line;
- }
- cout<<cnt<<" : "<<line<<endl;
- cnt++;
- }
- cout<<"rand line : "<<str_save<<endl;
- ins.close();
- }
这里的if(RandInt(1,cnt)==1)里的1,可以是[1,cnt]中任意一个值,概率均为1/cnt。
5、随机读取k行
先去读k行,保存在一个数组中(假设文件至少有k行);
然后每读取一行,都以k/n的概率替换数组中的任意一行,其中n为当前总共读取的行数。
- /** @brief 从文件fname中随机读取k行
- */
- void GetRandLines(const char *fname, int k)
- {
- cout<<__FUNCTION__<<": ";
- string * kstr = new string[k], line;
- ifstream ins(fname);
- int cnt=1;
- while(cnt<=k)///先读取前k行
- {
- if(getline(ins,kstr[cnt-1])) cnt++;
- else break;///文件没有k行,直接退出
- }
- while(getline(ins,line))
- {
- if(RandInt(1,cnt)<=k)/// p=k/cnt
- {
- swap(kstr[RandInt(1,k)-1],line);///随机替换一行
- }
- cnt++;
- }
- for(int i=0; i<k ;i++)
- {
- cout<<kstr[i]<<endl;
- }
- cout<<endl;
- delete[] kstr;
- ins.close();
- }
其他问题请参考《编程珠玑-第12章》。
转载出处:http://blog.csdn.net/fastsort/article/details/10162871
【C/C++】随机数问题的更多相关文章
- .Net使用system.Security.Cryptography.RNGCryptoServiceProvider类与System.Random类生成随机数
.Net中我们通常使用Random类生成随机数,在一些场景下,我却发现Random生成的随机数并不可靠,在下面的例子中我们通过循环随机生成10个随机数: ; i < ; i++) { Rando ...
- DotNet生成随机数的一些方法
在项目开发中,一般都会使用到“随机数”,但是在DotNet中的随机数并非真正的随机数,可在一些情况下生成重复的数字,现在总结一下在项目中生成随机数的方法. 1.随机布尔值: /// <summa ...
- JavaScript 随机数
JavaScript内置函数random(seed)可以产生[0,1)之间的随机数,若想要生成其它范围的随机数该如何做呢? 生成任意范围的随机数 //生成[100,120)之间的随机数 Math.fl ...
- SQL Server 随机数,随机区间,随机抽取数据rand(),floor(),ceiling(),round(),newid()函数等
在查询分析器中执行:select rand(),可以看到结果会是类似于这样的随机小数:0.36361513486289558,像这样的小数在实际应用中用得不多,一般要取随机数都会取随机整数.那就看下面 ...
- 随机数(random)
需求 Random rd=new Random(); 需要十以内的随机数 (0---10) System.out.println((int)((rd.nextDouble()*100)/10)); ...
- [LeetCode] Insert Delete GetRandom O(1) 常数时间内插入删除和获得随机数
Design a data structure that supports all following operations in average O(1) time. insert(val): In ...
- Python 随机数用法
1. random.seed(int) 给随机数对象一个种子值,用于产生随机序列. 对于同一个种子值的输入,之后产生的随机数序列也一样. 通常是把时间秒数等变化值作为种子值,达到每次运行产生的随机系列 ...
- C语言产生标准正态分布或高斯分布随机数
C语言 产生标准正态分布或高斯分布 随机数 产生正态分布或高斯分布的三种方法: 1. 运用中心极限定理(大数定理) #include #include #define NSUM 25 double g ...
- C语言基础(11)-随机数发生器
一. rand() rand是一个C语言库函数,功能是生成一个随机数.rand需要一个不同的种子,才能生成不同的随机数. 二. srand(int seed) rand需要一个不同的种子,才能生成不同 ...
- shell 指定范围产生随机数
#/bin/bash echo "---------------产生随机数---------------" read -p "请输入起始数:" a read - ...
随机推荐
- 去除inline-block之间的间隙
在使用display: inline-block;时,这些inline-block之间会有间隙,根据无双 - <去除inline-block元素间的空隙>的说法,这个间隙是4px或者8px ...
- sublime text 也能矩形选择
原来用editplus,但发现sublime text后便果断选择这个,她真的是很完美,但有一点就是不能像editplus一样矩形选择(Ctrl+鼠标左键这我知道,但感觉很麻烦)而感到小小的不爽... ...
- C# 正则表达式测试工具与分享窗体自适应类
放假刚回来,自己打算写一个正则表达式的测试工具,因为上次在网上用的一个在线正则表示测试工具就 没有很好的服务自己的,所以才有了现在的想法,想写一个C#开发者用的正则表达式测试工具!期间由于最大化时控件 ...
- 使用NHibernate(7)-- 一对一 && 一对多 && 多对多
1, 一对一. 对于数据量比较大的时候,考虑查询的性能,肯能会把一个对象的属性分到两个表中存放:比如用户和用户资料,经常使用的一般是Id和用户名,用户资料(学校,籍贯等)是不经常被查询的,所以就会分成 ...
- 设置jenkins代理
http://stackoverflow.com/documentation/jenkins/919/introduction-to-jenkins Natively, Jenkins runs on ...
- Cocos2d-x3.6 Android编译问题
在Cocod2d-x论坛上看到越来越多人吐槽新版本更新太快,改动太大,而且经常有BUG导致升级要折腾很久很久..但我就是喜欢折腾,喜欢升级到最新版本,看看有了哪些新功能,哪些改进.为此也折腾了不少,遇 ...
- fckeditor使用(转)
fckeditor - (1)资料介绍与安装 fckeditor介绍 FCKeditor是一个专门使用在网页上属于开放源代码的所见即所得文字编辑器. 1.fckeditor官网:http://ww ...
- 【软件架构】IM架构设计(安卓版)
1. 架构总览 2. 模块介绍 2.1 协议封装与任务流程 2.1.1 协议与任务的封装 协议有协议头(协议头因为格式相同,被抽象出来)和协议体组成,协议有两类:请求协议(request)和回复协议( ...
- ORM SQLOBJECT SIMPLE
step01: (Install sqlobject) sudo easy_install sqlobject step02: (Connect MySQL) step03: (Install sup ...
- paip.提升性能----硬盘不同转速不同缓存对比转
paip.提升性能----硬盘不同转速不同缓存对比转 西数 WDC WD2500BEVT-08A23T1 ( 250 GB / 5400 转/分 ) 5400转 8M缓存 单碟250 GB ...