C++大数据的读写

当一个文件1G以上的这种，使用内存文件映射会提高读写效率；

下边时段出自《windows核心编程》，读取一个大文件，然后统计里边字符出现次数的函数：

__int64 CountOs(void)

{

    // Get system granularity

    SYSTEM_INFO sinf;

    GetSystemInfo(&sinf);

    // open the data file

    HANDLE hFile = CreateFile(TEXT("C:\\1.TXT"), GENERIC_READ, FILE_SHARE_READ, NULL, OPEN_EXISTING, FILE_FLAG_SEQUENTIAL_SCAN, NULL);

    // create the file-mapping object.

    HANDLE hFileMapping = CreateFileMapping(hFile, NULL, PAGE_READONLY, 0, 0, NULL);

    DWORD dwFileSizeHight;

    __int64 qwFileSize = GetFileSize(hFile, &dwFileSizeHight);

    qwFileSize += (((__int64)dwFileSizeHight) << 32);

    // we no longer need access to the file object's handle.

    CloseHandle(hFile);

    __int64 qwFileOffset = 0, qwNumOf0s = 0;

    while (qwFileSize > 0)

    {

        DWORD dwBytesInBlock = sinf.dwAllocationGranularity;

        if (qwFileSize < sinf.dwAllocationGranularity)

            dwBytesInBlock = (DWORD)qwFileSize;

        PBYTE pbFile = (PBYTE)MapViewOfFile(hFileMapping, FILE_MAP_READ, (DWORD)(qwFileOffset >> 32), (DWORD)(qwFileOffset & 0xFFFFFFFF), dwBytesInBlock);

        // count the number of 0s in this block.

        for (DWORD dwByte = 0; dwByte < dwBytesInBlock; dwByte++)

        {

            if (pbFile[dwByte] == 'r')

                qwNumOf0s++;

        }

        // unmap the view; we don't want multiple views

        // in our address space.

        UnmapViewOfFile(pbFile);

        // skip to the next set of bytes in the file.

        qwFileOffset += dwBytesInBlock;

        qwFileSize -= dwBytesInBlock;

    }

    CloseHandle(hFileMapping);

    return qwNumOf0s;

}


如果是往里边写数据就用 memcpy把数据考入pbFile指向的内存。还有就是把读标志该成写标志；

C++大数据的读写的更多相关文章

spring Batch实现数据库大数据量读写
spring Batch实现数据库大数据量读写博客分类: spring springBatchquartz定时调度批处理 1. data-source-context.xml <?xml v ...
kettle大数据量读写mysql性能优化
修改kettleDB连接设置 1. 增加批量写的速度:useServerPrepStmts=false rewriteBatchedStatements=true useCompressio ...
谁说EXCEL不能处理大数据？那是你用错了工具
我是一名数据分析师,每天需要和各种各样的数据和表格打交道,是一名名副其实的"表哥",不仅需要制作和更新公司里的日报.周报和月报,有时候也要为公司的会议准备各种数据材料.由于公司的业 ...
POI读写大数据量excel，解决超过几万行而导致内存溢出的问题
1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是256列,2007版及以后的版本最大行数是1048576行,最大列数是16384 ...
大数据-06-Spark之读写Hive数据
简介 Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据.Hive本身不存储数据,它完全依赖HDFS和MapReduce.这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整的SQL查询 ...
大数据【二】HDFS部署及文件读写（包含eclipse hadoop配置）
一原理阐述 1' DFS 分布式文件系统(即DFS,Distributed File System),指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连.该系统架构 ...
POI读写大数据量EXCEL
另一篇文章http://www.cnblogs.com/tootwo2/p/8120053.html里面有xml的一些解释. 大数据量的excel一般都是.xlsx格式的,网上使用POI读写的例子比较 ...
大数据系列2：Hdfs的读写操作
在前文大数据系列1:一文初识Hdfs中,我们对Hdfs有了简单的认识. 在本文中,我们将会简单的介绍一下Hdfs文件的读写流程,为后续追踪读写流程的源码做准备. Hdfs 架构首先来个Hdfs的架构 ...
大数据查询——HBase读写设计与实践
导语:本文介绍的项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询.原实现基于 Oracle 提供存储查询服务,随着数据量的 ...

随机推荐

JNPF.java前后端分离框架，SpringBoot+SpringCloud开发微服务平台
JNPF.java版本采用全新的前后端分离架构模式.前后端分离已成为互联网项目开发的业界标准开发方式,通过 nginx+tomcat 等方式有效的进行解耦合,并且前后端分离会为以后的大型分布式架构.弹 ...
MTK 虚拟 sensor bring up (pick up) sensor2.0
pick up bring up sensor2.0 1.SCP侧的配置 (1) 放置驱动pickup.c (2) 添加底层驱动文件编译开关 (3) 加入编译文件 (4) 增加数据上报方式 (5)修改 ...
【Java面试】Kafka 怎么避免重复消费
Hi,大家好,我是Mic 一个工作5年的粉丝找到我. 他说: "Mic老师,你要是能回答出这个问题,我就佩服你" 我当场就懵了,现在打赌都这么随意了吗? 我问他问题是什么,他说&q ...
端口被占用的问题解决 Web server failed to start. Port ×× was already in use
出现此问题是端口被占用了,只需要关闭正在使用的端口就行解决思路: 1.在服务器中更改port端口号,改为不冲突,没有被占用的端口. 2.找出被占用的端口,结束被占用的端口解决结束被占用的端口的方法 ...
java中常见的锁
1.悲观锁认为别的线程都会修改数据,二话不说先锁上 synchronized 2.乐观锁乐观豁达,起初不操作.最后修改的时候比对一下版本,不一致再上锁 3.可重入锁外层锁了之后,内层仍可以直接使 ...
mybatis转义反斜杠_MyBatis Plus like模糊查询特殊字符_、\、%
在MyBatis Plus中,使用like查询特殊字符_,\,%时会出现以下情况: 1.查询下划线_,sql语句会变为"%_%",会导致返回所有结果.在MySQL中下划线" ...
字节跳动数据平台技术揭秘：基于 ClickHouse 的复杂查询实现与优化
更多技术交流.求职机会.试用福利,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 ClickHouse 作为目前业内主流的列式存储数据库(DBMS)之一,拥有着同类型 DBMS 难以企及 ...
NC20439 [SHOI2017]期末考试
NC20439 [SHOI2017]期末考试题目题目描述有 \(n\) 位同学,每位同学都参加了全部的 \(m\) 门课程的期末考试,都在焦急的等待成绩的公布.第 \(i\) 位同学希望在第 \ ...
《吐血整理》保姆级系列教程-玩转Fiddler抓包教程(2)-初识Fiddler让你理性认识一下
1.前言今天的理性认识主要就是讲解和分享Fiddler的一些理论基础知识.其实这部分也没有什么,主要是给小伙伴或者童鞋们讲一些实际工作中的场景,然后隆重推出我们的猪脚(主角)-Fiddler. 1. ...
JDBCTools 第一个版本
JDBCToolV1: package com.dgd.test; import com.alibaba.druid.pool.DruidDataSourceFactory; import javax ...

C++大数据的读写

C++大数据的读写的更多相关文章

随机推荐

热门专题