• 什么是mmap
    • mmap对于c程序员很熟悉,对于java程序员有点陌生。简而言之,将文件直接映射到用户态的内存地址,这样对文件的操作不再是write/read,而是直接对内存地址的操作。

      在c中提供了三个函数来实现
      [list]
  • mmap 进行映射
  • munmap 取消映射
  • msync 进程在映射空间的对共享内容的改变并不直接写回到磁盘文件中,往往在调用munmap()后才执行该操作。

具体参照http://blog.chinaunix.net/uid-24517893-id-164217.html

  • java中的map

java中的FileChannel,提供了map和force方法,map创建文件和内存的映射,

  1. MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);

返回一个MappedByteBuffer,这是一个DirectBuffer,其中包含一个内存地址,然后可用就做一些读写操作。 
    还有另外一个方法是force,是将内存的更新的内容刷到磁盘中。 
    在这里抛出一个问题,force是必须调用的,如果不调用force会怎样。 
    我试着写了一段小程序来试验

  1. MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);
  2. for (int i = 0;i< 100000;i++){
  3. buffer.put((byte)65);
  4. }
  5. System.out.println("write completed!");
  6. System.in.read();

然后观察文件发现文件中是有1000个B的,那么就是说不调用force,内容也会落到磁盘中的。既然不用force内容也可以落到磁盘中,那force的作用什么呢?带着这个问题我查看了openJdk的force和map的实现和linux中mmap的实现。

  • JDK的force和map的实现

通过FileChannel->FileChannelImpl的native知道,对linux平台调用应该在D:\git\openjdk\jdk\src\solaris\native\sun\nio\ch下的FileChannelImpl.c

  1. NIEXPORT jlong JNICALL
  2. Java_sun_nio_ch_FileChannelImpl_map0(JNIEnv *env, jobject this,
  3. jint prot, jlong off, jlong len)
  4. mapAddress = mmap64(
  5. 0,                    /* Let OS decide location */
  6. len,                  /* Number of bytes to map */
  7. protections,          /* File permissions */
  8. flags,                /* Changes are shared */
  9. fd,                   /* File descriptor of mapped file */
  10. off);                 /* Offset into file */
  1. JNIEXPORT jint JNICALL
  2. Java_sun_nio_ch_FileChannelImpl_force0(JNIEnv *env, jobject this,
  3. jobject fdo, jboolean md)
  4. {
  5. jint fd = fdval(env, fdo);
  6. int result = 0;
  7. if (md == JNI_FALSE) {
  8. result = fdatasync(fd);
  9. } else {
  10. result = fsync(fd);
  11. }
  12. return handle(env, result, "Force failed");
  13. }

原来force是调用的fdatasync(fsync),这不是linux中buffered IO,write(2)以后需要调用的方法吗,难道mmap也是走的BufferdIO那一套,首先写到page cache,然后由pdflush定时刷到磁盘中,那这么说mmap只是在进程空间分配一个内存地址,真实的内存还是使用的pagecache。所以force是调用fsync将dirty page刷到磁盘中,但mmap还有共享之类的实现起来应该很复杂。

  • 验证

为了验证上面的假设,我做了一个实验。在linux下起两个终端,A终端通过上面的程序向a.txt写入数据,B终端使用tailf a.txt观察数据的写入。奇怪的是A终端执行完,B终端立马就成看到数据,而不是等30s以后pdflush刷到磁盘以后才能看到,难道前面的假设错了?或者另一种可能tailf查看到也是在page cache中读取的。那只需查看下文件的page是不是dirty就知道了。

  1. cat /proc/$(pidof java)/smaps|grep a.txt -A 10 -B 10

就可以查看一个文件的page是否是dirty。 
重新实现使用如上脚本观察

  1. 2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299                   /opt/zhanghailei/a.txt
  2. Size:               980 kB
  3. Rss:                980 kB
  4. Shared_Clean:         0 kB
  5. Shared_Dirty:         0 kB
  6. Private_Clean:        0 kB
  7. Private_Dirty:      980 kB
  8. Swap:                 0 kB
  9. Pss:                980 kB

果然是dirty的,然后继续等待一段时间再次执行发现已经是clean,被刷到磁盘中。

  1. 2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299                   /opt/zhanghailei/a.txt
  2. Size:               980 kB
  3. Rss:                980 kB
  4. Shared_Clean:         0 kB
  5. Shared_Dirty:         0 kB
  6. Private_Clean:      980 kB
  7. Private_Dirty:        0 kB
  8. Swap:                 0 kB
  9. Pss:                980 kB
  • 结论

1. mmap,底层还是走的BufferedIO,好处大概是减少了内核态和用户态的内存拷贝,这点不太确定,对内核不熟。 
2. force,参数为true调用fsync,false调用fdatasync,fdatasync只刷数据不刷meta数据 
3. 即使不调用force,内核也会定期将dirty page刷到磁盘,默认是30s。

原文来自:http://xiaoz5919.iteye.com/blog/2093323

java中的mmap实现--转的更多相关文章

  1. Java中9种常见的CMS GC问题分析与解决

    1. 写在前面 | 本文主要针对 Hotspot VM 中"CMS + ParNew"组合的一些使用场景进行总结.重点通过部分源码对根因进行分析以及对排查方法进行总结,排查过程会省 ...

  2. 【Java】Java中的零拷贝

    物理内存 计算机物理内存条的容量,比如我们买电脑会关注内存大小有多少G,这个容量就是计算机的物理内存. 虚拟内存 操作系统为每个进程分配了独立的虚拟地址空间,也就是虚拟内存,虚拟地址空间又分为用户空间 ...

  3. java中的锁

    java中有哪些锁 这个问题在我看了一遍<java并发编程>后尽然无法回答,说明自己对于锁的概念了解的不够.于是再次翻看了一下书里的内容,突然有点打开脑门的感觉.看来确实是要学习的最好方式 ...

  4. java中的字符串相关知识整理

    字符串为什么这么重要 写了多年java的开发应该对String不陌生,但是我却越发觉得它陌生.每学一门编程语言就会与字符串这个关键词打不少交道.看来它真的很重要. 字符串就是一系列的字符组合的串,如果 ...

  5. Java中的Socket的用法

                                   Java中的Socket的用法 Java中的Socket分为普通的Socket和NioSocket. 普通Socket的用法 Java中的 ...

  6. java中Action层、Service层和Dao层的功能区分

    Action/Service/DAO简介: Action是管理业务(Service)调度和管理跳转的. Service是管理具体的功能的. Action只负责管理,而Service负责实施. DAO只 ...

  7. Java中常用集合操作

    一.Map 名值对存储的. 常用派生类HashMap类 添加: put(key,value)往集合里添加数据 删除: clear()删除所有 remove(key)清除单个,根据k来找 获取: siz ...

  8. java中的移位运算符:<<,>>,>>>总结

    java中有三种移位运算符 <<      :     左移运算符,num << 1,相当于num乘以2 >>      :     右移运算符,num >& ...

  9. 关于Java中进程和线程的详解

    一.进程:是程序的一次动态执行,它对应着从代码加载,执行至执行完毕的一个完整的过程,是一个动态的实体,它有自己的生命 周期.它因创建而产生,因调度而运行,因等待资源或事件而被处于等待状态,因完成任务而 ...

随机推荐

  1. linux平台上面python调用c

    不能免俗,先打印个helloworld出来,c代码的函数 hello.c #include <stdio.h> int helloworld() { printf("hello ...

  2. ZeroBraneStudio之支持GBK文件编码

    费了好大劲终于搞定了让ZBS支持打开GBK文件了.记录下过程: 看源码发现ZBS打开文件时会调用src\editor\commands.lua中的LoadFile函数,代码如下: local file ...

  3. LightOJ_1038 Race to 1 Again

    题目链接 题意: 给一个数n, 每次操作是随机的选择一个[1,N]区间内能够被n整除的数进行除法, 然后得到一个新的n. 问n变成1时的期望操作次数. 思路: 设E[n] 为 当数为x时, 变成 1 ...

  4. C#委托(Delegate)学习日记

    在.NET平台下,委托类型用来定义和响应应用程序中的回调.事实上,.NET委托类型是一个类型安全的对象,指向可以以后调用的其他方法.和传统的C++函数指针不同,.NET委托是内置支持多路广播和异步方法 ...

  5. java答疑

    问 什么是 Java 的字节码? 答 它是程序的一种低级表示,可以运行于 Java 的虚拟机.将程序抽象为字节码可以保证 Java 程序员的 代码能够运行在各种设备之上. 问 Java 允许整型溢出并 ...

  6. win7系统VPN设置

    为了解除公司上网策略限制,或者为了上Google,Facebook,都可以通过设置VPN实现. 要使用VPN需要到VPN服务商注册,链接VPN服务商. ======================== ...

  7. 开启Eclipse 智能感知代码功能

    1.打开windows->Perferences..窗口,选择java->Editor->Content Assist,在右下方的“Auto Activation triggers  ...

  8. oracle的存储过程语法(转)

    1.ORA-00942: table or view does not exist 指的你要操作的表尚未存在,需要先create出来先. 2.ORA-00922: missing or invalid ...

  9. 查看TEMP使用情况

    SQL> select * from v$mystat where rownum<2; SID STATISTIC#    VALUE ---------- ---------- ---- ...

  10. [LeetCode#256] Paint House

    Problem: There are a row of n houses, each house can be painted with one of the three colors: red, b ...