最近一直抽空学习shell,脚本语言看多了多多少少有些蛋疼不适,所以捡起以前遇到的一个C语言的问题看看。

原先应该是在C++吧关注的一个帖子,楼主为了测试数据库性能需要如下形式的数据
要求:

  • 字符串长度为16
  • 字符串只能包含大小写字母和数字
  • 要求生成20000000行的TXT文本

/**********************************
* Author: Ervin_Zhao(2012.6)
* Compile: gcc
* Create a file named test.txt, included 2000w line random string
* string have 16 num used A-Z, a-z, 0-9
*/ #include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h> int main(void)
{
char array[]="QWERTYUIOPASDFGHJKLZXCVBNMqwertyuiopasdfghjklzxcvbnm1234567890";
char buff[170000];
char *buff2 = buff;
int file = open("test.txt", O_WRONLY|O_CREAT, S_IRWXU|S_IRGRP|S_IROTH);
int i;
int temp[4];
char *p = (char *)temp;
for(i = 0; i<20000000; i++)
{
temp[0] = rand();
temp[1] = rand();
temp[2] = rand();
temp[3] = rand(); buff2[0] = array[p[0]%(sizeof(array)-1)];
buff2[1] = array[p[1]%(sizeof(array)-1)];
buff2[2] = array[p[2]%(sizeof(array)-1)];
buff2[3] = array[p[3]%(sizeof(array)-1)]; buff2[4] = array[p[4]%(sizeof(array)-1)];
buff2[5] = array[p[5]%(sizeof(array)-1)];
buff2[6] = array[p[6]%(sizeof(array)-1)];
buff2[7] = array[p[7]%(sizeof(array)-1)]; buff2[8] = array[p[8]%(sizeof(array)-1)];
buff2[9] = array[p[9]%(sizeof(array)-1)];
buff2[10] = array[p[10]%(sizeof(array)-1)];
buff2[11] = array[p[11]%(sizeof(array)-1)]; buff2[12] = array[p[12]%(sizeof(array)-1)];
buff2[13] = array[p[13]%(sizeof(array)-1)];
buff2[14] = array[p[14]%(sizeof(array)-1)];
buff2[15] = array[p[15]%(sizeof(array)-1)]; buff2[16] = '\n';
buff2 += 17; if(buff2 >= (buff+sizeof(buff)))
{
write(file, buff, sizeof(buff));
buff2 = buff;
}
}
close(file);
return 0;
}

这个程序结构的清晰,易于理解,真是个不错的程序

最初收藏的时候没时间去看,最近有空细看了下,在生成随机数那里看了半天,自己的底子实在是有点薄、

通过实验,原理是这样的。定义为INT形的数组,rand();函数产生8位的十六进制数,四个元素的数组,那么就是32位。

通过p指针把数组重新“翻译”,作为字符读取,2位一个字符,那么就是16个字符。通过array[p[0]%(sizeof(array)-1)]就可以随机取得array中的字符了

而且为了避免频繁读写IO,内存中待数据1万行才写入文件中,勉强看懂,叫自己写肯定是写不出。这就是学过和学会C语言的区别吧、

下面来看看另一个程序

/**********************************
* Author:yjf_victor(2012.6)
* Compile: gcc
* Create a file named test.txt, included 2000w line random string
* string have 16 num used A-Z, a-z, 0-9
*/ #include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <sys/mman.h>
#include <unistd.h>
#include <time.h> int main ( void )
{
int i, j;
const int cols = 16;
const int rows = 20000000;
const int size = ( cols + 1 ) * rows;
const char str[] = "QWERTYUIOPASDFGHJKLZXCVBNMqwertyuiopasdfghjklzxcvbnm1234567890";
const char filename[] = "file.txt";
char * p = NULL;
char * pStart = NULL;
int fd;
p = pStart = (char *)malloc( size * sizeof(char) );
if ( p == NULL )
{
fprintf ( stderr, "内存申请失败。\n" );
return EXIT_FAILURE;
}
srand( time(NULL) );
for ( i = 0 ; i < rows; i ++ )
{
for ( j = 0 ; j < cols; j ++ )
{
*(p ++) = str[rand()%(62)];
}
*(p ++) = '\n';
}
fd = open( filename, O_WRONLY|O_CREAT, S_IRUSR|S_IWUSR );
if ( fd == -1 )
{
fprintf ( stderr, "文件打开错误。\n" );
return EXIT_FAILURE;
}
write ( fd, pStart, size );
free( pStart );
close(fd);
return EXIT_SUCCESS;
}

本以为这个更难一些呢,读起来确是很好理解。而且程序写的很棒,参数易于修改

有时想想,大一学的C语言,也不深入学习,也不去实践、也只够写个学生信息管理系统了。

这个生成2000w行数据的,估计我会一个一个的生成随机数,然后估计一顿饭的时间是等不出来结果了…==

有吧友也通过汇编实现1秒5,由于没有环境,就不运行了,有兴趣的可以去看原帖,原帖地址:http://tieba.baidu.com/p/1626351476 (已为坟,勿回)

想来shell应该也能实现这一要求,所以去弄了个shell版本的

tr -dc A-Za-z0-9 < /dev/urandom |fold -w 16 |head -20000000 > file.txt

比较简单,一行码~嘿嘿,效率嘛、有舍就有得嘛~~
初学shell就是伤不起。。。连入门都没,别说写出高效简洁的shell脚本了,本来这个shell想自己写来着,但是下意识的想去用C语言的过程化设计来实现,思维有很多时候跳不出来

这真是。。。路漫漫,慢慢走吧、、

C语言生成2000w行数据的更多相关文章

  1. sql server之ROW_NUMBER() OVER()取每组的第N行数据

    先看个例子: document_id card_holder_id created_date document_type_id 1 1 2015-7-1 1 2 4 2015-7-2 1 3 4 20 ...

  2. 逗号分隔的字符串转换为行数据(collection)(续)

    逗号分隔的字符串转行数据的存储过程一个: CREATE OR REPLACE FUNCTION SP_YX_SPLIT ( p_list CLOB, p_sep VARCHAR2 := ',' ) R ...

  3. 逗号分隔的字符串转换为行数据(collection)

    逗号分隔的字符串转换为行数据(collection) CREATE OR REPLACE FUNCTION "GET_STR_TAB" (v_str in varchar2) re ...

  4. hive中同列多行数据组合的方法以及array to string要点(行转列)

    1. 同列多行数据组合成一个字段cell的方法, top N 问题的hive方案 如下: hive 列转行 to json与to array list set等复杂结构,hive topN的提取的窗口 ...

  5. PHP 表单提交多行数据,显示多个submit

    echo "<table border=1 class="imagetable" >"; //使用表格格式化数据echo "<for ...

  6. 怎样为DataTable设置主键及找行数据

    只要是数据集中都应该存在主键,以确定数据集中唯一的值.那么,我们要如何为DataTable设置主键及利用主键在DataTable索引值呢? 步骤/方法     为DataTable设置主键 DataT ...

  7. Oracle一列的多行数据拼成一行显示字符

    Oracle一列的多行数据拼成一行显示字符   oracle 提供了两个函数WMSYS.WM_CONCAT 和 ListAgg函数.    www.2cto.com   先介绍:WMSYS.WM_CO ...

  8. 05. 取SQL分组中的某几行数据

    对表中数据分组,有时只需要某列的聚合值:有时却需要返回整行数据,常用的方法有:子查询.ROW_NUMBER.APPLY,总体感觉还是ROW_NUMBER比较直观.测试数据: if OBJECT_ID( ...

  9. ADO.NET笔记——使用Connection连接数据库,使用Command对象的ExecuteReader()方法创建DataReader对象返回多行数据

    使用Connection连接数据库,使用DataReader访问数据库,并返回多行数据. 相关步骤: 需要引入两个命名空间 using System.Data; using System.Data.S ...

随机推荐

  1. ssl通关的概念(一个)

    在公司最近的项目涉及多种加密.安全.我一直在这方面缺乏经验.很协议仅仅知道是什么概念.用于传输的加密SSL,也煞费苦心.非常easy一件事,折腾了很长一段时间.IT该行啊,真的是.难者不会,与会者困难 ...

  2. Repository、IUnitOfWork和IDbContext

    DDD 领域驱动设计-谈谈Repository.IUnitOfWork和IDbContext的实践 上一篇:<DDD 领域驱动设计-谈谈 Repository.IUnitOfWork 和 IDb ...

  3. DOM笔记2

    <!-- 节点类型检查 if(someNode.nodeType==ElementNode){ alert("Node is an element"); } 或者 if(so ...

  4. 走向DBA[MSSQL篇] 详解游标

    原文:走向DBA[MSSQL篇] 详解游标 前篇回顾:上一篇虫子介绍了一些不常用的数据过滤方式,本篇详细介绍下游标. 概念 简单点说游标的作用就是存储一个结果集,并根据语法将这个结果集的数据逐条处理. ...

  5. 【白注意】Windows XP 大胆拥抱Linux在系统中所遇到的问题

    Windows XP至4月8日本将不再是微软官方技术支持.虽然仍可以继续使用,但他们大部分的风险.可一不留神被黑客攻击.似向下,Linux这也是一个不错的选择. 或许很多文章开始教你如何迁移,您,迁移 ...

  6. iOS一个开发系列中 - UIButton 使用摘要

    // 初始化button并设置类型 UIButton *btn = [UIButton buttonWithType:UIButtonTypeRoundedRect]; // 可以定义的UIButto ...

  7. 无插件,直接加参数,chrome它可以模拟手机浏览器

    在目标出现,加上一些参数即可:--user-agent="mozilla/5.0 (linux; u; android 2.3.3; en-us; sdk build/ gri34) app ...

  8. 记2014“蓝桥杯全国软件大赛&quot;决赛北京之行

    5月29,30日 最终到了这一天.晚上有数据结构课,10点多的火车,我们就没有去上课,下午在宿舍里收拾东西,晚上8点左右从南校出发,9点半多到达火车站和老师学长学姐们会和. 第一次去北京,第一次买的卧 ...

  9. printf交替使用

    今天附带printf一些替代实现. 转载请注明出处:http://blog.csdn.net/u010484477谢谢^_^ 我们总是用printf做各种输出语句: printf("%d&q ...

  10. 十天学Linux内核之第六天---调度和内核同步

    原文:十天学Linux内核之第六天---调度和内核同步 心情大好,昨晚我们实验室老大和我们聊了好久,作为已经在实验室待了快两年的大三工科男来说,老师让我们不要成为那种技术狗,代码工,说多了都是泪啊,, ...