C++大数据的读写

当一个文件1G以上的这种，使用内存文件映射会提高读写效率；

下边时段出自《windows核心编程》，读取一个大文件，然后统计里边字符出现次数的函数：

__int64 CountOs(void)

{

    // Get system granularity

    SYSTEM_INFO sinf;

    GetSystemInfo(&sinf);

    // open the data file

    HANDLE hFile = CreateFile(TEXT("C:\\1.TXT"), GENERIC_READ, FILE_SHARE_READ, NULL, OPEN_EXISTING, FILE_FLAG_SEQUENTIAL_SCAN, NULL);

    // create the file-mapping object.

    HANDLE hFileMapping = CreateFileMapping(hFile, NULL, PAGE_READONLY, 0, 0, NULL);

    DWORD dwFileSizeHight;

    __int64 qwFileSize = GetFileSize(hFile, &dwFileSizeHight);

    qwFileSize += (((__int64)dwFileSizeHight) << 32);

    // we no longer need access to the file object's handle.

    CloseHandle(hFile);

    __int64 qwFileOffset = 0, qwNumOf0s = 0;

    while (qwFileSize > 0)

    {

        DWORD dwBytesInBlock = sinf.dwAllocationGranularity;

        if (qwFileSize < sinf.dwAllocationGranularity)

            dwBytesInBlock = (DWORD)qwFileSize;

        PBYTE pbFile = (PBYTE)MapViewOfFile(hFileMapping, FILE_MAP_READ, (DWORD)(qwFileOffset >> 32), (DWORD)(qwFileOffset & 0xFFFFFFFF), dwBytesInBlock);

        // count the number of 0s in this block.

        for (DWORD dwByte = 0; dwByte < dwBytesInBlock; dwByte++)

        {

            if (pbFile[dwByte] == 'r')

                qwNumOf0s++;

        }

        // unmap the view; we don't want multiple views

        // in our address space.

        UnmapViewOfFile(pbFile);

        // skip to the next set of bytes in the file.

        qwFileOffset += dwBytesInBlock;

        qwFileSize -= dwBytesInBlock;

    }

    CloseHandle(hFileMapping);

    return qwNumOf0s;

}


如果是往里边写数据就用 memcpy把数据考入pbFile指向的内存。还有就是把读标志该成写标志；

C++大数据的读写的更多相关文章

spring Batch实现数据库大数据量读写
spring Batch实现数据库大数据量读写博客分类: spring springBatchquartz定时调度批处理 1. data-source-context.xml <?xml v ...
kettle大数据量读写mysql性能优化
修改kettleDB连接设置 1. 增加批量写的速度:useServerPrepStmts=false rewriteBatchedStatements=true useCompressio ...
谁说EXCEL不能处理大数据？那是你用错了工具
我是一名数据分析师,每天需要和各种各样的数据和表格打交道,是一名名副其实的"表哥",不仅需要制作和更新公司里的日报.周报和月报,有时候也要为公司的会议准备各种数据材料.由于公司的业 ...
POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
大数据-06-Spark之读写Hive数据
简介 Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据.Hive本身不存储数据,它完全依赖HDFS和MapReduce.这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整的SQL查询 ...
大数据【二】HDFS部署及文件读写（包含eclipse hadoop配置）
一原理阐述 1' DFS 分布式文件系统(即DFS,Distributed File System),指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连.该系统架构 ...
POI读写大数据量EXCEL
另一篇文章http://www.cnblogs.com/tootwo2/p/8120053.html里面有xml的一些解释. 大数据量的excel一般都是.xlsx格式的,网上使用POI读写的例子比较 ...
大数据系列2：Hdfs的读写操作
在前文大数据系列1:一文初识Hdfs中,我们对Hdfs有了简单的认识. 在本文中,我们将会简单的介绍一下Hdfs文件的读写流程,为后续追踪读写流程的源码做准备. Hdfs 架构首先来个Hdfs的架构 ...
大数据查询——HBase读写设计与实践
导语:本文介绍的项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询.原实现基于 Oracle 提供存储查询服务,随着数据量的 ...

随机推荐

mysql刷题笔记
近期,为提升自己的工程能力,在休息时常通过刷题来回顾一下基础性知识. 于是选择了牛客网上的mysql知识题库练手,过程中,主要遇到了几个比较有意思的题,记录下来,方便回顾. 题1:SQL29 计算用户 ...
用Arduino显示颜色序列（u8g2，OLED）
目录用Arduino显示颜色序列(u8g2,OLED) 用Arduino显示颜色序列(u8g2,OLED) 提前祝大家新年快乐! 主控:Arduino Mega 2560 硬件:126×64 OLE ...
c++ 超大整数除法高精度除法
c++ 超大整数除法高精度除法解题思路计算a/b,其中a为大整数,b为普通整数,商为c,余数为r. 根据手算除法的规则,上一步的余数记为r,则本次计算的被除数为t=r*10+被除数的本位数值a[ ...
数字化转型之数字资产知识库（springboot+es+vue+neo4j）
前言在数字化高度普及的时代,企事业机关单位在日常工作中会产生大量的文档,例如医院制度汇编,企业知识共享库等.针对这些文档性的东西,手工纸质化去管理是非常消耗工作量的,并且纸质化查阅难,易损耗,所以电 ...
当JAVA注解、AOP、SpEL相遇，更多可能变为了现实
常规情况下,我们可以通过业务定制化的注解,借助AOP机制来实现某些通用的处理策略.比如定义个@Permission注解,可以用于标识在具体的方法上,然后用来指定某个方法必须要指定角色的人才能够访问调用 ...
WTM框架使用技巧之:CI/CD(持续集成/持续部署)
1. 什么是WTM框架? 一个快速.灵活.社区活跃.最最最最高效的.netcore 后台管理系统.详见 https://wtmdoc.walkingtec.cn/ 欢迎大家付费支持WTMPlus,反哺 ...
3D还原货拉拉女孩身亡真相，这一环值得反思！
货拉拉女孩跳车身亡的消息,让人惋惜又震惊.司机多次偏离原始路线,女孩最终选择跳车,结果不幸身亡. 货拉拉女孩跳车真相被3D还原有人质疑平台监管不力,造成如此惨剧,有人吐槽企业压榨员工,司机绕路是不得 ...
web文本划线的极简实现
开篇文本划线是目前逐渐流行的一个功能,不管你是小说阅读网站,还是卖教程的的网站,一般都会有记笔记或者评论的功能,传统的做法都是在文章底部加一个评论区,优点是简单,统一,缺点是不方便对文章的某一段或一 ...
全新升级的AOP框架Dora.Interception[6]: 框架设计和实现原理
本系列前面的五篇文章主要介绍Dora.Interception(github地址,觉得不错不妨给一颗星)的编程模式以及对它的扩展定制,现在我们来聊聊它的设计和实现原理.(拙著<ASP.NET C ...
VScode运行总是显示running状态
一.每次点击运行都显示code is already running,而且键盘也没有办法输入二.解决办法注意:记得重新启动VScode

C++大数据的读写

C++大数据的读写的更多相关文章

随机推荐

热门专题