《windows核心编程系列》十六谈谈内存映射文件
内存映射文件允许开发人员预订一块地址空间并为该区域调拨物理存储器,与虚拟内存不同的是,内存映射文件的物理存储器来自磁盘中的文件,而非系统的页交换文件。将文件映射到内存中后,我们就可以在内存中操作他们了,就像他们被载入内存中一样。
内存映射文件主要有三方面的用途:
1:系统使用内存映射文件来将exe或是dll文件本身作为后备存储器,而非系统页交换文件,这大大节省了系统页交换空间,由于不需要将exe或是dll文件加载到页系统交换文件,也提高了启动速度。
2:使用内存映射文件来将磁盘上的文件映射到进程的空间区域,使得开发人员操作文件就像操作内存数据一样,将对文件的操作交由操作系统来管理,简化了开发人员的工作。
3:windows提供了多种进程间通信的方法,但他们都是基于内存映射文件来实现的。
这里首先讨论第一种情况:
在一个exe文件运行之前,系统首先为新进程创建一个进程内核对象,同时预订一块足够大的地址空间来容纳该文件。然后,对该地址空间进行标注,注明他的后备存储器来自exe文件,而非系统的页交换文件。此措施对提高系统性能有重大意义。
一个可执行文件,当他有多个实例同时运行,系统在创建另一个新的实例时,仅仅是打开了另一个内存映射视图。所有这些视图都来自于同一个文件映射对象(即可执行文件本身)。
当新实例开始运行时,系统只是把包含应用程序代码和数据的虚拟内存页面映射到了他的地址空间中,当其中的一个实例试图去修改数据段中的数据,如果不采取有效措施,那么应用程序的所有其他实例的内存都会被修改,这是不合常理的。因此windows采取了一种叫做写时复制的特性,来防止这种情况的发生。
系统将可执行文件映射到地址空间中时,会计算有多少页面是可写的。(通常包含数据的页面被标记为PAGE_READWRITE属性,它们是可写的)然后会从系统的页交换文件中调拨物理存储器,来容纳这些可写的页面。但是系统只是调拨这些页面,并不会实际载入页面的内容,只有当写入可写页面的时候才会真正实际载入。(后面会详细介绍)
任何时候当应用程序试图写入内存映射文件的时候,系统会截获此类尝试,接着从先前在系统页交换文件中分配的空间中取出一页,复制要写入页面的内容,让应用程序写入刚刚从系统页交换文件中分配的页,而不是内存映射文件中的页。由于写入到的区域仅仅是内存映射文件的副本,不会对内存映射文件写入,这样就保证了其他实例不会受到任何影响。另外需要注意的是,内存映射文件的副本(在系统页交换文件中)被映射到了新实例的地址空间区域的同一位置。
以上介绍的是在同一个可执行文件的多个实例之间不会共享数据的情况。有时候在多个实例之间共享数据非常有用,可以大大提高编程效率。接着我们就讨论如何在一个可执行文件的多个实例中共享数据。
我们知道默认情况下,我们定义的初始化数据被放到了数据段,未初始化的数据放到了.bss段。除了使用这些标准段之外,我们也可以将数据放在我们自己的段中。
首先,就要知道如何创建一个段。
#pragm data_seg("sectionname")//创建一个名为sectionname的段。
看例子:
#pragm data_seg("newsection")//此处创建一个名为newsection的段
int a=23;//向此段中添加变量。
#pragm data_seg()//结束添加
此例创建了一个名为newsection的段,并向此段添加int类型变量a。#pragm data_seg()用于结束向段中添加数据。
要注意一点编译器只会将以初始化的变量放入我们的段中,如上例中的a。
如果这样:
#pragm data_seg("newsection")
int a=23;
int b;
#pragm data_seg()
b是不会被添加到段newsection中的。而是放到默认的标准段中。
虽然编译器只会将初始化的变量放入自定义段中,但是我们可以强制的将一个未初始化的数据放我任何我们想放入的段中。
_declspec(allocate("newsection") ) int b;将b放入newsection中。
仅仅新建一个段,并将要共享的数据放入新建段中是不够的,还需要将该段声明为共享段。
我们可以使用:
1: #pragm comment(linker,"/SECTION:newsection,RWS")
2:链接器开关:/SECTON:newsecton,RWS
其中R表示READ,W表示WRITE,S表示SHARE。他们为newsection指定的属性。SHARE即为共享的意思,意思是把此段让所有实例共享。
放入共享段的变量在多个实例中只有一份,不会再向数据段中的变量一样:每个实例都有一个副本。所以任何实例都可以修改它们。非常重要的一点就是:由于多个实例可以同时修改共享段中的变量,因此要注意同步问题。可以采取线程同步中所介绍的一些方法。
现在来讨论内存映射文件介绍的第二个用途:内存映射磁盘数据文件。
要使用内存映射磁盘文件需要三个步骤:
1:创建或打开一个文件内核对象。
2:创建一个文件映射内核对象。
3:将文件映射对象映射到进程地址空间。
对于第一点,可以调用CreateFile或是OpenFile,很简单,此处不作介绍。
HANDLE WINAPI CreateFile(
__in LPCTSTR lpFileName,
__in DWORD dwDesiredAccess,
__in DWORD dwShareMode,
__in_opt LPSECURITY_ATTRIBUTES lpSecurityAttributes,
__in DWORD dwCreationDisposition,
__in DWORD dwFlagsAndAttributes,
__in_opt HANDLE hTemplateFile
);
第二点:可以调用CreateFileMapping
HANDLE WINAPI CreateFileMapping(
__in HANDLE hFile,
__in_opt LPSECURITY_ATTRIBUTES lpAttributes,
__in DWORD flProtect,
__in DWORD dwMaximumSizeHigh,
__in DWORD dwMaximumSizeLow,
__in_opt LPCTSTR lpName
);
第一个hFile为要映射到进程地址空间中的文件句柄,CreateFile或是OpenFile返回。
第二个psa为安全属性,一般都传NULL,表示使用默认安全属性。
第三个为fdwProtect保护属性,指定当将文件映射到进程地址空间的时候,应该给物理存储器的页面指定何种保护属性。
第四个,第五个参数告诉系统内存映射文件的最大大小。
第四个参数dwMaximumSizeHigh为表示文件大小的64位整数的高字节,dwMaximumSizeLow为低字节。对于小于4G的文件来说,高字节当然为0.
如果要以文件的当前大小创建一个映射对象时,只要将他们设为0就可以。如果要文件中添加数据,一定要使指定的大小大于文件的真实大小。
第六个参数为文件映射内核对象的名称。用于跨进程共享命名内核对象。(请参考windows核心编程 第五版 第三章)需要特别强调下,如果为flProtect指定PAGE_READWRITE属性,当文件的真实大小小于参数中指定的大小的时候,CreateFileMapping会自动增大文件大小。为的是在将文件作为内存映射文件后,物理存储器已经就绪。向其写入数据不会发生错误。如果指定PAGE_READONLY或是PAGE_WRITECOPY,那么传入的大小不能大于文件的真实大小,因为我们只并不能向文件中增加数据。
第三步:将文件映射到进程地址空间。
MapViewOfFile
LPVOID WINAPI MapViewOfFile(
__in HANDLE hFileMappingObject,
__in DWORD dwDesiredAccess,
__in DWORD dwFileOffsetHigh,
__in DWORD dwFileOffsetLow,
__in SIZE_T dwNumberOfBytesToMap
);
第一个参数hFileMappingObject即为CreateFileMapping或是OpenFileMapping返回的文件映射内核对象句柄。
第二个参数是访问数据的方式。他们依赖于CreateFileMapping 和CreateFile传递的访问方式。
第三个和第四个参数告诉系统把数据文件中的的那些内容映射到进程地址空间中。他们分别为要映射文件的偏移 量,是64位的,分别表示高32位和低32位。
第五个参数指明要把磁盘文件的多少数据映射到进程地址空间中。如果指定为0,系统会把文件中从偏移量开始直到文件末尾的数据全部映射到进程地址空间中。
当调用MapViewOfFile时指定FILE_MAP_COPY标志,系统会从系统页交换文件调拨物理存储器,大小有dwNumberOfBytesToMap指定。只要我们不执行读取数据之外的任何操作,系统就不会使用从页交换文件中调拨页面 。但是一旦有任何线程写入文件映射视图的任何地址,系统就会从已经调拨的页交换文件中选择一个页面把原始数据复制到页交换文件中的页面,然后让线程进行修改这个副本,再将此页面映射到进程地址空间中。因此任何线程都只会修改数据的副本而不会修改原始数据。
当不再需要把文件中的数据映射到进程的地址空间的时候,可以调用UnmapViewOfFile 来释放映射的数据。
BOOL WINAPI UnmapViewOfFile(
__in LPCVOID lpBaseAddress
);
lpBaseAddress用于指定区域的基地址,必须和MapViewOfFile相同。
为了提高运行速度,系统会对文件数据的页面进行缓存处理,也就是说对文件映射对象映射后的视图进行修改,不会立即反映到数据文件中。如果想要立即反映到数据文件中,可以调用FlushViewOfFile。来强制系统把修改过的数据协会磁盘文件。
如果视图最初使用FILE_MAP_COPY标志来映射的,那么对数据文件的修改实际上对系统页交换文件中的副本进行的修改。请参考红色字段。如果这种情况下调用FlushViewOfFile,系统不会将做出的修改保存到磁盘文件中,而会直接释放系统页交换文件中的相关数据,导致数据丢失。这只是FILE_MAP_COPY的特性,为了防止数据丢失可以用其他标志进行映射。
最后不要忘记调用CloseHandle关闭文件内核对象和文件映射内核对象。
如果文件非常大,一次无法全部映射到进程的地址空间中,这是该怎么办呢?
此时可以每次只映射一部分文件到进程空间,使用完毕后,撤销映射。再映射下一部分,使用完毕后再次撤销映射。如此循环往复。直至将整个文件映射完毕 。
系统允许我们把一个数据文件映射到多个视图中。如果我们使用的是同一个文件映射对象映射到不同视图,一旦有一个视图中的数据被修改,其他视图中会立刻更新进而显示更新后的视图。也就是说各个视图中的数据是一致的。为什么各个视图的数据都是一致的呢?
因为他们都是从同一个文件映射对象映射的,数据文件在内存中只有一份,却映射到了不同视图中。但要注意,此处有一前提,就是各个视图都是有同一文件映射对象映射的,如果是同一数据文件为后备存储器创建不同文件映射对象,那就不能保证他们的数据是一致的了。为了防止这种情况,可以在CreateFile时将dwShareMode 设为独占对文件的访问。从而防止不一致性。
注意:在使用完内存映射文件后一定要先撤销对视图的映射和关闭文件映射对象句柄,在对执行打开文件等对文件进行的操作。否则将会造成执行文件操作的失败。另外,执行的操作又失败的可能性,一定要检查。(2011年11月24日,在写文件逆置程序时,撤销对视图的映射后,没有关闭文件映射对象的句柄就执行文件操作,结果这些文件操作都失败了。但是没有执行判断,花了好久才查到错误。)
下面来讨论第三个问题:内存映射文件实现进程间共享数据。
如果我们在创建文件映射对象时为它命名,那么就可以实现在不同进程间访问同一文件映射内核对象了。但要注意,要在不同进程分别调用MapViewOfFile,来将同一命名文件映射内核对象,映射到各自的进程地址空间中。
到此,以我们目前掌握的知识,我们知道要实现在多个进程间共享数据,要创建一个文件对象和一个命名的文件映射内核对象。然后在另一个进程内将此命名的内核对象映射到本进程。这一系列的步骤说明:如果我们要在多个进程间共享数据,我们就必须创建文件,将数据保存在文件中,然后创建文件对象,文件映射对象。。。。这是很繁琐的。
Microsoft意识到了这一点,为我们提供了支持:让系统创建以页交换文件为后备存储器的内存映射文件。这就是说当实现进程共享数据时,不再需要创建以磁盘文件为后备存储器的文件映射对象。此时,文件映射对象的后备存储器来自系统页交换文件。这种方法和为磁盘文件创建内存映射文件几乎完全相同。区别就是:此时无需创建文件对象,在创建文件映射对象时,只需将INVALID_HANDLE_VALUE传给hFile就可以了。他告诉系统要以系统页交换文件中调拨物理存储器。以后的步骤跟为磁盘文件创建内存映射文件相同。
很简单,不是吗?来看个例子:
HANDLE hFile=CreateFile(...)
HANDLE hMap=CreateFileMapping(hFile........);
if(hMap==NULL)
{
.....................
}
看出来什么问题吗?
我们知道调用CreateFile失败的时候,返回的是INVALID_HANDLE_VALUE,而此处没有判断文件对象是否成功,就直接创建文件映射对象,一旦创建文件对象失败,hFile就是INVALID_HANDLE_VALUE,系统会以为程序员要创建以系统页交换文件为后备存储器的内存映射文件,而不是为磁盘文件创建内存映射文件。这就导致了错误。所以在可能导致失败的函数执行之后一定要进程判断。
参考自《windows核心编程—第五版》第三部分,以上仅仅是个人总结,如有纰漏,请不吝赐教,谢谢。同时,想结交志同道合之士,交流windows核心编程的学习。
《windows核心编程系列》十六谈谈内存映射文件的更多相关文章
- 《windows核心编程系列 》六谈谈线程调度、优先级和关联性
线程调度.优先级和关联性 每个线程都有一个CONTEXT结构,保存在线程内核对象中.大约每隔20ms windows就会查看所有当前存在的线程内核对象.并在可调度的线程内核对象中选择一个,将其保存在C ...
- 《windows核心编程系列》十七谈谈dll
DLL全称dynamic linking library.即动态链接库.广泛应用与windows及其他系统中.因此对dll的深刻了解,对计算机软件开发专业人员来说非常重要. windows中所有API ...
- 《windows核心编程系列》二谈谈ANSI和Unicode字符集 .
http://blog.csdn.net/ithzhang/article/details/7916732转载请注明出处!! 第二章:字符和字符串处理 使用vc编程时项目-->属性-->常 ...
- 《Windows核心编程系列》十三谈谈在应用程序中使用虚拟内存
在应用程序中使用虚拟内存 Windows提供了以下三种机制对内存进行操控: 一:虚拟内存.最适合来管理大型对象数据或大型结构数组. 二:内存映射文件.最适合用来管理大型数据流,以及在同一机 器上运行的 ...
- 《Windows核心编程系列》八谈谈用内核对象进行线程同步
使用内核对象进行线程同步. 前面我们介绍了用户模式下线程同步的几种方式.在用户模式下进行线程同步的最大好处就是速度非常快.因此当需要使用线程同步时用户模式下的线程同步是首选. 但是用户模式下的线程同步 ...
- 《windows核心编程系列》七谈谈用户模式下的线程同步
用户模式下的线程同步 系统中的线程必须访问系统资源,如堆.串口.文件.窗口以及其他资源.如果一个线程独占了对某个资源的访问,其他线程就无法完成工作.我们也必须限制线程在任何时刻都能访问任何资源.比如在 ...
- 《Windows核心编程系列》十一谈谈Windows线程池
Windows线程池 上一篇博文我们介绍了IO完成端口.得知IO完成端口可以非常智能的分派线程.但是IO完成端口仅对等待它的线程进行分派,创建和销毁线程的工作仍然需要我们自己来做. 我们自己也可以创建 ...
- 《windows核心编程系列》四谈谈进程的建立和终止
第二部分:工作机理 第一章:进程 上一章介绍了内核对象,这一节开始就要不断接触各种内核对象了.首先要给大家介绍的是进程内核对象.进程大家都不陌生,它是资源和分配的基本单位,而进程内核对象就是与进程相关 ...
- 《windows核心编程系列》五谈谈线程基础
线程基础 与前面介绍的进程一样,线程也有两部分组成.一个是线程内核对象.它是一个数据结构,操作系统用它来管理线程以及用它来存储线程的一些统计信息.另一个是线程栈,用于维护线程执行时所需的所有函数参数和 ...
随机推荐
- Java的finally语句在try或catch中的return语句执行之后还是之前?
import java.util.HashMap; import java.util.Map; public class FinallyDemo1 { public static void main( ...
- 利用百度地图Android sdk高仿微信发送位置功能
接触了百度地图开发平台半个月了,这2天试着模仿了微信给好友发送位置功能,对百度地图的操作能力又上了一个台阶 (假设须要完整demo.请评论留下邮箱) (眼下源代码已经不发送,假设须要源代码.加qq31 ...
- oracle rac 安装错误整理。
今天是2014.05.26,离别N久的博客今天继续使用. 近期一直忙着离职.入职另外加上家的网一直没有交费,弄的自己開始不那么安稳.学习就是须要一种心情平静.内心稳妥的去进行. 因换笔记本,特须要又一 ...
- OpenWrt 安装python-sqlite3失败
https://dev.openwrt.org/ticket/12239 #12239 reopened defect Sqlite3 missing in python 汇报人: dgspai@- ...
- UVA 4857 Halloween Costumes 区间背包
题目链接:https://icpcarchive.ecs.baylor.edu/index.php?option=com_onlinejudge&Itemid=8&page=show_ ...
- JSONObjectWithData方法里options參数选择解释
NSJSONReadingMutableContainers Specifies that arrays and dictionaries are created as mutable object ...
- react 中的 PureComponent
React.PureComponent最重要的一个用处就是优化React应用,因为它减少了应用中的渲染次数,所以对性能的提升是非常可观的. 原理:在普通的 componnet 组件中,shouldCo ...
- Trie(前缀树)和ternary trie和binary search tree
1 什么是trie trie是一棵多叉树,假如存放的是由26个字母(不区分大小写)构成的字符串的话,那么就是一棵26叉树. trie树是一棵前缀树,因为每个结点只保存字符串中的一个字符,整个字符串保存 ...
- call function
1 call递归扩展变量 本质上仍然是变量扩展,等价于$(),只不过扩展的时候带了参数,$(call xxx)返回的是xxx扩展之后的值.参数依次赋值给$(1),$(2)......,但是参数要在赋值 ...
- vmware中鼠标在部分区域不能使用
https://blog.csdn.net/dreamengsoul/article/details/80439278 方法1:重装VMware tools; 方法2:使用增强型键盘鼠标: 方法3:检 ...