linux内核之情景分析mmap操作
进程可以通过mmap把一个已打开文件映射到用户空间.
mmap(void*start,size_t length,int prot,int flags,int fd,off_t offset)
asmlinkage long sys_mmap2(unsigned long addr, unsigned long len,unsigned long prot, unsigned long flags,unsigned long fd, unsigned long pgoff){return do_mmap2(addr, len, prot, flags, fd, pgoff);}
/* common code for old and new mmaps */static inline long do_mmap2(unsigned long addr, unsigned long len,unsigned long prot, unsigned long flags,unsigned long fd, unsigned long pgoff){int error = -EBADF;struct file * file = NULL;flags &= ~(MAP_EXECUTABLE | MAP_DENYWRITE);if (!(flags & MAP_ANONYMOUS)) {//map_anonymous表示没有文件,只是在指定位置分配内存file = fget(fd);//上一条表示,没有文件,就跳过if以下,有文件则打开文件if (!file)//如果文件不存在,直接返回错误goto out;}down(¤t->mm->mmap_sem);//信号量down操作error = do_mmap_pgoff(file, addr, len, prot, flags, pgoff);//mmap主体操作还是这个up(¤t->mm->mmap_sem);//信号量up操作if (file)fput(file);out:return error;}
do_mmap_pgoff(file, addr, len, prot, flags, pgoff);
unsigned long do_mmap_pgoff(struct file * file, unsigned long addr, unsigned long len,unsigned long prot, unsigned long flags, unsigned long pgoff){struct mm_struct * mm = current->mm;//获取当前进程的内存描述符struct vm_area_struct * vma;int correct_wcount = 0;int error;//file非0表示是文件,其对应一定有相关操作函数.if (file && (!file->f_op || !file->f_op->mmap))return -ENODEV;//长度对齐,如果为0,直接返回if ((len = PAGE_ALIGN(len)) == 0)return addr;//长度大于3g或者addr+len映射区域超过用户空间,返回错误if (len > TASK_SIZE || addr > TASK_SIZE-len)return -EINVAL;// 偏移量是否超过了长度/* offset overflow? */if ((pgoff + (len >> PAGE_SHIFT)) < pgoff)return -EINVAL;//映射次数是否超过了限定/* Too many mappings? */if (mm->map_count > MAX_MAP_COUNT)return -ENOMEM;//是否加锁?这里不知道了/* mlock MCL_FUTURE? */if (mm->def_flags & VM_LOCKED) {unsigned long locked = mm->locked_vm << PAGE_SHIFT;locked += len;if (locked > current->rlim[RLIMIT_MEMLOCK].rlim_cur)return -EAGAIN;}/* Do simple checking here so the lower-level routines won't have* to. we assume access permissions have been handled by the open* of the memory object, so we don't do any here.*/if (file != NULL) { //如果文件存在switch (flags & MAP_TYPE) {//映射类型:读写case MAP_SHARED://共享映射if ((prot & PROT_WRITE) && !(file->f_mode & FMODE_WRITE))return -EACCES;//确保我们不被允许写在一个只可追加的文件/* Make sure we don't allow writing to an append-only file.. */if (IS_APPEND(file->f_dentry->d_inode) && (file->f_mode & FMODE_WRITE))return -EACCES;//确保我们的文件没有锁/* make sure there are no mandatory locks on the file. */if (locks_verify_locked(file->f_dentry->d_inode))return -EAGAIN;/* fall through */case MAP_PRIVATE://私有映射if (!(file->f_mode & FMODE_READ))return -EACCES;break;default:return -EINVAL;}}/* Obtain the address to map to. we verify (or select) it and ensure* that it represents a valid section of the address space.*/if (flags & MAP_FIXED) {//如果参数flag的标志位map_fixed为0表示,指定映射位置只是一个参考值if (addr & ~PAGE_MASK)return -EINVAL;} else {//不满足由内核从空洞执行分配一个区域addr = get_unmapped_area(addr, len);if (!addr)return -ENOMEM;}/* Determine the object being mapped and call the appropriate* specific mapper. the address has already been validated, but* not unmapped, but the maps are removed from the list.*/vma = kmem_cache_alloc(vm_area_cachep, SLAB_KERNEL);//从slab获取一个vma结构if (!vma)return -ENOMEM;vma->vm_mm = mm;//指向内存描述符vma->vm_start = addr;//vma的起始地址指向映射的起始地址vma->vm_end = addr + len;//同上vma->vm_flags = vm_flags(prot,flags) | mm->def_flags;//设置vma属性if (file) {//如果file为0,表示匿名映射,仅仅是为了创建虚拟区间,或者仅在于建立从物理空间到虚存空间映射,而非文件映射VM_ClearReadHint(vma);//以下代码设置一堆属性vma->vm_raend = 0;if (file->f_mode & FMODE_READ)vma->vm_flags |= VM_MAYREAD | VM_MAYWRITE | VM_MAYEXEC;if (flags & MAP_SHARED) {vma->vm_flags |= VM_SHARED | VM_MAYSHARE;/* This looks strange, but when we don't have the file open* for writing, we can demote the shared mapping to a simpler* private mapping. That also takes care of a security hole* with ptrace() writing to a shared mapping without write* permissions.** We leave the VM_MAYSHARE bit on, just to get correct output* from /proc/xxx/maps..*/if (!(file->f_mode & FMODE_WRITE))vma->vm_flags &= ~(VM_MAYWRITE | VM_SHARED);}} else {vma->vm_flags |= VM_MAYREAD | VM_MAYWRITE | VM_MAYEXEC;if (flags & MAP_SHARED)vma->vm_flags |= VM_SHARED | VM_MAYSHARE;}vma->vm_page_prot = protection_map[vma->vm_flags & 0x0f];vma->vm_ops = NULL;vma->vm_pgoff = pgoff;//表示所映射内容在文件的起点,此值用于发生缺页异常根据虚存地址计算出相应页面的文件位置vma->vm_file = NULL;vma->vm_private_data = NULL;/* Clear old maps */error = -ENOMEM;if (do_munmap(mm, addr, len))//检查目的地址的vma空间是否已经使用(如果map_fixed设置为1的话)goto free_vma;//已经使用则释放free_vma//检查是否超过了限制/* Check against address space limit. */if ((mm->total_vm << PAGE_SHIFT) + len> current->rlim[RLIMIT_AS].rlim_cur)goto free_vma;//检查当前进程专用的可写区间而物理页面不足的情况/* Private writable mapping? Check memory availability.. */if ((vma->vm_flags & (VM_SHARED | VM_WRITE)) == VM_WRITE &&!(flags & MAP_NORESERVE) &&!vm_enough_memory(len >> PAGE_SHIFT))goto free_vma;if (file) {//vm_deanwrite职位表示从文件到vma映射,表示不允许同过常规方式读写文件if (vma->vm_flags & VM_DENYWRITE) {error = deny_write_access(file);if (error)goto free_vma;correct_wcount = 1;}vma->vm_file = file;get_file(file);//递增file结构的共享计数error = file->f_op->mmap(file, vma);//一个文件操作必须存在mmap,否则释放vmaif (error)goto unmap_and_free_vma;} else if (flags & MAP_SHARED) {//共享映射error = shmem_zero_setup(vma);if (error)goto free_vma;}/* Can addr have changed??*为了防止flags与addr有变化,再重新设置一遍,* Answer: Yes, several device drivers can do it in their* f_op->mmap method. -DaveM*/flags = vma->vm_flags;addr = vma->vm_start;insert_vm_struct(mm, vma);//插入当前进程的内存描述符if (correct_wcount)atomic_inc(&file->f_dentry->d_inode->i_writecount);mm->total_vm += len >> PAGE_SHIFT;//映射区域+len>>page_shitif (flags & VM_LOCKED) {//需要加锁mm->locked_vm += len >> PAGE_SHIFT;make_pages_present(addr, addr + len);//建立初始映射}return addr;unmap_and_free_vma:if (correct_wcount)atomic_inc(&file->f_dentry->d_inode->i_writecount);vma->vm_file = NULL;fput(file);/* Undo any partial mapping done by a device driver. */flush_cache_range(mm, vma->vm_start, vma->vm_end);zap_page_range(mm, vma->vm_start, vma->vm_end - vma->vm_start);flush_tlb_range(mm, vma->vm_start, vma->vm_end);free_vma:kmem_cache_free(vm_area_cachep, vma);return error;}
linux内核之情景分析mmap操作的更多相关文章
- Linux内核源代码情景分析系列
http://blog.sina.com.cn/s/blog_6b94d5680101vfqv.html Linux内核源代码情景分析---第五章 文件系统 5.1 概述 构成一个操作系统最重要的就 ...
- Linux内核源代码情景分析-fork()
父进程fork子进程: child = fork() fork经过系统调用.来到了sys_fork.具体过程请參考Linux内核源码情景分析-系统调用. asmlinkage int sys_fork ...
- linux 内核源代码情景分析——linux 内核源代码中的C语言代码
linux 内核的主体是以GNU的C语言编写的,GNU为此提供了编译工具gcc.GNU对C语言本身作了不少扩充. 1) gcc 从 C++ 语言中吸收了"inline"和" ...
- linux 内核源代码情景分析——地址映射的全过程
linux 内核采用页式存储管理.虚拟地址空间划分成固定大小的"页面",由MMU在运行时将虚拟地址映射成某个物理内存页面中的地址.页式内存管理比段式内存管理有很多好处,但是由于In ...
- linux 内核源代码情景分析——linux 内存管理的基本框架
386 CPU中的页式存管的基本思路是:通过页面目录和页面表分两个层次实现从线性地址到物理地址的映射.这种映射模式在大多数情况下可以节省页面表所占用的空间.因为大多数进程不会用到整个虚存空间,在虚存空 ...
- linux 内核源代码情景分析——用户堆栈的扩展
上一节中,我们浏览了一次因越界访问而造成映射失败从而引起进程流产的过程,不过有时候,越界访问时正常的.现在我们就来看看当用户堆栈过小,但是因越界访问而"因祸得福"得以伸展的情景. ...
- linux 内核源代码情景分析——越界访问
页式存储管理机制通过页面目录和页面表将每个线性地址转换成物理地址,当遇到下面几种情况就会使CPU产生一次缺页中断,从而执行预定的页面异常处理程序: ① 相应的页面目录或页表项为空,也就是该线性地址与物 ...
- linux 内核源代码情景分析——几个重要的数据结构和函数
页面目录PGD.中间目录PMD和页面表PT分别是由表项pgd_t.pmd_t和pte_t构成的数组,而这些表项都是数据结构 1 /* 2 * These are used to make use of ...
- linux 内核源代码情景分析——linux 内核源码中的汇编语言代码
1. 用汇编语言编写部分核心代码的原因: ① 操作系统内核中的底层程序直接与硬件打交道,需要用到一些专用的指令,而这些指令在C语言中并无对应的语言成分: ② CPU中的一些特殊指令也没有对应的C语言成 ...
随机推荐
- Android Studio 安装与使用ADB wifi 无线调试
首先,安装ADB WIFI File->Settings->Plugins 其次,用USB连接手机与电脑(并开启手机的调试模式) 任务栏若无提示,即可拔下USB线,开始无线调试 任务栏若是 ...
- linux命令学习-2
1. 对于已经在前台执行的命令,可以重新放到后台执行,首先按ctrl+z暂停已经运行的进程,然后使用jobs查看进程编号n:2. bg命令将停止的作业放到后台运行 bg %n3. kill -9 XX ...
- 动态规划:HDU1160-FatMouse's Speed(记录动态规划状态转移过程)
FatMouse's Speed Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
- “帮你APP”团队冲刺1
1.整个项目预期的任务量 (任务量 = 所有工作的预期时间)和 目前已经花的时间 (所有记录的 ‘已经花费的时间’),还剩余的时间(所有工作的 ‘剩余时间’) : 所有工作的预期时间:88h 目前已经 ...
- centos使用--zsh
目录 1 切换到zsh 1.1 查看系统当前的shell 1.2 查看bin下是否有zsh包 1.3 安装zsh包 1.4 切换shell至zsh 2 安装oh-my-zsh 2.1 oh-my-zs ...
- iOS下单例模式实现(一)(objective-c arc gcd)
单例模式确保某一个类只有一个实例,而且自行实例化并向整个系统提供这个实例. 这里主要介绍下在arc下,利用gcd实现单例. 第一步:声明一个静态实例 static SoundTool *_instan ...
- C#入门篇-3:数据类型及转换
using System; using System.Text; using System.Collections; using System.Collections.Generic; //003 查 ...
- 【Rotate List】cpp
题目: Given a list, rotate the list to the right by k places, where k is non-negative. For example:Giv ...
- MongoDB快速入门学习笔记5 MongoDB的文档修改操作
db.集合名称.update({query},{update},upsert, multi})query:过滤条件update:修改内容upsert:如果不存在查询条件查出的记录,是否插入一条数据,默 ...
- Mac: mac git 的安装 及实现自动补全
1.检查是否装了brew $ brew list 如果没有,拷贝以下命令到终端 回车.可以安装好brewruby -e "$(curl -fsSL https://raw.githubuse ...