【内存管理】CMA内存分配器（Contiguous Memory Allocator）

什么是CMA

参考这两篇博文，写得很好：

http://www.wowotech.net/memory_management/cma.html

https://www.cnblogs.com/LoyenWang/p/12182594.html

CMA的初始化创建

* 默认cma创建（dma_contiguous_default_area），两种方式：

通过cmdline传递的参数"cma="，然后在kernel初始化阶段解析参数，并调用start_kernel()->setup_arch()->arm64_memblock_init()->dma_contiguous_reserve()完成创建（android中一般不通过cmdline传递）：

static phys_addr_t size_cmdline = -1;

static phys_addr_t base_cmdline;

static phys_addr_t limit_cmdline;

//解析cmdline传递的cma参数

static int __init early_cma(char *p)

{

	pr_debug("%s(%s)\n", __func__, p);

	size_cmdline = memparse(p, &p);

	if (*p != '@')

		return 0;

	base_cmdline = memparse(p + 1, &p);

	if (*p != '-') {

		limit_cmdline = base_cmdline + size_cmdline;

		return 0;

	}

	limit_cmdline = memparse(p + 1, &p);

	return 0;

}

early_param("cma", early_cma);

通过dts中配置cma节点，属性中包含"shared-dma-pool"以及"linux,cma-default"，在kernel初始化阶段，通过调用start_kernel()->setup_arch()->arm64_memblock_init()->early_init_fdt_scan_reserved_mem()->fdt_init_reserved_mem()->__reserved_mem_init_node()完成对默认cma的创建和初始化：

static int __init __reserved_mem_init_node(struct reserved_mem *rmem)

{

	extern const struct of_device_id __reservedmem_of_table[];

	const struct of_device_id *i;

	//__reservedmem_of_table是初始化中的一个section段，通过RESERVEDMEM_OF_DECLARE定义的都会被链接到这个段中

	//参考：https://blog.csdn.net/rikeyone/article/details/79975138

	for (i = __reservedmem_of_table; i < &__rmem_of_table_sentinel; i++) {

		reservedmem_of_init_fn initfn = i->data;

		const char *compat = i->compatible;

		if (!of_flat_dt_is_compatible(rmem->fdt_node, compat))

			continue;

		if (initfn(rmem) == 0) {

			pr_info("initialized node %s, compatible id %s\n",

				rmem->name, compat);

			return 0;

		}

	}

	return -ENOENT;

}

//dma-contiguous.c文件中定义了该默认cma的创建回调。

//如果dts中没有配置，那该回调也不会执行。

//参考：https://blog.csdn.net/rikeyone/article/details/79975138

RESERVEDMEM_OF_DECLARE(cma, "shared-dma-pool", rmem_cma_setup);

默认cma似乎在好些android平台上都没有创建。

*其他CMA区创建

其他CMA区域创建都应该类似默认cma一样，通过RESERVEDMEM_OF_DECLARE接口定义一个结构体变量在__reservedmem_of_table段中，开机启动时就会调用对应的initfn完成初始化，同时还需要在dts中配置对应的属性节点。
所有CMA的创建最终都会调用cma_init_reserved_mem()函数：
1. 主要从cma全局数组cma_areas中分配一个cma实体并将传递过来的参数用于初始化该cam实体。
2. 初始化参数包括，cma的name、起始页框号base_pfn，总共页数count，以及每个bit代表多少个页2^(order_per_bit)。
3. 更新全局变量totalcma_pages，记录总的cma页面数量，在meminfo中CmaTotal就是这个值。

int __init cma_init_reserved_mem(phys_addr_t base, phys_addr_t size,

				 unsigned int order_per_bit,

				 const char *name,

				 struct cma **res_cma)

{

	struct cma *cma;

	phys_addr_t alignment;

	/* Sanity checks */

    //判断cma数量是否已经满了，因为cma_areas数组指定了系统中总的cma数量，通过内核宏控制

	if (cma_area_count == ARRAY_SIZE(cma_areas)) {

		pr_err("Not enough slots for CMA reserved regions!\n");

		return -ENOSPC;

	}

    //判断该cma内存区间是否与reversed中的某个区间是交叉的？为什么要这样判断？

	if (!size || !memblock_is_region_reserved(base, size))

		return -EINVAL;

	/* ensure minimal alignment required by mm core */

    //对齐方式按pageblock，也就是1024页（4M）

	alignment = PAGE_SIZE <<

			max_t(unsigned long, MAX_ORDER - 1, pageblock_order);

	/* alignment should be aligned with order_per_bit */

    //判断对齐方式alignment本身的大小与单个bit表示的内存大小，是否对齐

	if (!IS_ALIGNED(alignment >> PAGE_SHIFT, 1 << order_per_bit))

		return -EINVAL;

    //判断base和size以aligment方式对齐后，得到的值是否还是原来的值，也就是判断base和size是否基于alignment对齐

	if (ALIGN(base, alignment) != base || ALIGN(size, alignment) != size)

		return -EINVAL;

	/*

	 * Each reserved area must be initialised later, when more kernel

	 * subsystems (like slab allocator) are available.

	 */

	 //1. memblock是系统最初的内存管理器，分为memory type和reserved type，CMA最开始就属于reserved type

	 //2. 运行到这里，就表示memblock已经建立，并且buddy还没建立，CMA在buddy前建立OK

	 //3. CMA建立OK后，接着memblock中的memory type会释放给buddy，reserved type则不会

	 //4. CMA作为特殊的reserved type，最终通过系统初始化调用cma_init_reserved_areas，将内存归还给buddy

    //从cma_areas数组中分配一个cma对象

	cma = &cma_areas[cma_area_count];

	if (name) {

		cma->name = name;

	} else {

		cma->name = kasprintf(GFP_KERNEL, "cma%d\n", cma_area_count);

		if (!cma->name)

			return -ENOMEM;

	}

	cma->base_pfn = PFN_DOWN(base); //起始页号

	cma->count = size >> PAGE_SHIFT; //总共页面数

	cma->order_per_bit = order_per_bit; //一个bit代表的阶数

	*res_cma = cma;

	cma_area_count++;

	totalcma_pages += (size / PAGE_SIZE); //totalcma_pages记录总的cma页面数量，在meminfo中CmaTotal就是这个值

	return 0;

}

到这里，只是完成对cma内存的保留和初始化，cma区最终还需要释放给buddy。

CMA区域释放给buddy

释放也是在kernel初始化过程中，会比cma的创建稍晚一些，是通过cma_init_reserved_areas接口完成的所有cma的初始化并将内存返还给buddy。
- core_initcall(cma_init_reserved_areas)定义在kernel的init段中，通过start_kernel()->rest_init()创建内核线程kernel_init->kernel_init_freeable()->do_basic_setup()->do_initcalls()完成对各个init level的初始化。core init属于level1。
cma_init_reserved_areas()函数，遍历当前cma全局数组中已经分配的cma实体，通过调用cma_activate_area函数完成激活初始化，同时将内存释放给buddy：

static int __init cma_init_reserved_areas(void)

{

	int i;

	for (i = 0; i < cma_area_count; i++) {

		int ret = cma_activate_area(&cma_areas[i]);

		if (ret)

			return ret;

	}

	return 0;

}

core_initcall(cma_init_reserved_areas);

cma_activate_area()函数：

以pageblock为单位，设置migrate type为MIGRATE_CMA，然后将其整个pageblock包含的页全部释放给buddy，并更新整个系统的可用内存总数

static int __init cma_activate_area(struct cma *cma)

{

	int bitmap_size = BITS_TO_LONGS(cma_bitmap_maxno(cma)) * sizeof(long);

	unsigned long base_pfn = cma->base_pfn, pfn = base_pfn;

    //i代表有多少个page block，一般一个pageblock是1024页

	unsigned i = cma->count >> pageblock_order;

	struct zone *zone;

    //cma也是通过bitmap来管理，每个bit代表多大，由order_per_bit决定。

    //默认的cma的order_per_bit为0，一个bit代表2^0个page。

    //分配bitmap

	cma->bitmap = kzalloc(bitmap_size, GFP_KERNEL);

	if (!cma->bitmap)

		return -ENOMEM;

	WARN_ON_ONCE(!pfn_valid(pfn));

	zone = page_zone(pfn_to_page(pfn));

    //以pageblock遍历，

	do {

		unsigned j;

        //记录当前pageblock的起始页

		base_pfn = pfn;

        //判断当前pageblock中的所有页面是否满足要求：合法的页号、都在同一个zone中

		for (j = pageblock_nr_pages; j; --j, pfn++) {

			WARN_ON_ONCE(!pfn_valid(pfn));

			/*

			 * alloc_contig_range requires the pfn range

			 * specified to be in the same zone. Make this

			 * simple by forcing the entire CMA resv range

			 * to be in the same zone.

			 */

			if (page_zone(pfn_to_page(pfn)) != zone)

				goto not_in_zone;

		}

        //将当前pageblock初始化并释放给buddy

		init_cma_reserved_pageblock(pfn_to_page(base_pfn));

	} while (--i);

	mutex_init(&cma->lock);

#ifdef CONFIG_CMA_DEBUGFS

	INIT_HLIST_HEAD(&cma->mem_head);

	spin_lock_init(&cma->mem_head_lock);

#endif

	return 0;

not_in_zone:

	pr_err("CMA area %s could not be activated\n", cma->name);

	kfree(cma->bitmap);

	cma->count = 0;

	return -EINVAL;

}

cma_activate_area()->init_cma_reserved_pageblock()函数设置pageblock类型并释放内存给buddy：

void __init init_cma_reserved_pageblock(struct page *page)

{

	unsigned i = pageblock_nr_pages;

	struct page *p = page;

	do {

        //清除页描述flag中的PG_Reserved标志位

		__ClearPageReserved(p);

        //设置page->_refcount = 0

		set_page_count(p, 0);

	} while (++p, --i);

    //设置pageblock的迁移类型为MIGRATE_CMA

	set_pageblock_migratetype(page, MIGRATE_CMA);

	if (pageblock_order >= MAX_ORDER) {

		i = pageblock_nr_pages;

		p = page;

		do {

			set_page_refcounted(p);

			__free_pages(p, MAX_ORDER - 1);

			p += MAX_ORDER_NR_PAGES;

		} while (i -= MAX_ORDER_NR_PAGES);

	} else {

        //设置page->_refcount = 1

		set_page_refcounted(page);

        //释放pages到buddy中，以pageblock释放，order为10

		__free_pages(page, pageblock_order);

	}

    //调整对应zone中的managed_pages可管理页面数，即加上一个pageblock数量

    //调整总的内存数量totalram_pages，即加上一个pageblock数量

	adjust_managed_page_count(page, pageblock_nr_pages);

}

CMA的分配

CMA分配通过统一接口cma_alloc函数，会从bitmap中先查找满足要求的连续bit，然后通过alloc_contig_range实现分配，成功后的页面会从buddy总摘出来：

struct page *cma_alloc(struct cma *cma, size_t count, unsigned int align,

		       gfp_t gfp_mask)

{

	unsigned long mask, offset;

	unsigned long pfn = -1;

	unsigned long start = 0;

	unsigned long bitmap_maxno, bitmap_no, bitmap_count;

	struct page *page = NULL;

	int ret = -ENOMEM;

	if (!cma || !cma->count)

		return NULL;

	pr_debug("%s(cma %p, count %zu, align %d)\n", __func__, (void *)cma,

		 count, align);

	if (!count)

		return NULL;

	mask = cma_bitmap_aligned_mask(cma, align);

	offset = cma_bitmap_aligned_offset(cma, align);

	bitmap_maxno = cma_bitmap_maxno(cma);

	bitmap_count = cma_bitmap_pages_to_bits(cma, count);

	if (bitmap_count > bitmap_maxno)

		return NULL;

	for (;;) {

		mutex_lock(&cma->lock);

        //1. 从cma->bitmap中查找连续bitmap_count个为0的bit

		bitmap_no = bitmap_find_next_zero_area_off(cma->bitmap,

				bitmap_maxno, start, bitmap_count, mask,

				offset);

		if (bitmap_no >= bitmap_maxno) {

			mutex_unlock(&cma->lock);

			break;

		}

        //2. 将查找到的连续bit设置为1，表示内存被分配占用

		bitmap_set(cma->bitmap, bitmap_no, bitmap_count);

		/*

		 * It's safe to drop the lock here. We've marked this region for

		 * our exclusive use. If the migration fails we will take the

		 * lock again and unmark it.

		 */

		mutex_unlock(&cma->lock);

        //3. 计算分配的起始页的页号

		pfn = cma->base_pfn + (bitmap_no << cma->order_per_bit);

		mutex_lock(&cma_mutex);

        //4. 分配从起始页开始的连续count个页，分配的migrate type为CMA类型

		ret = alloc_contig_range(pfn, pfn + count, MIGRATE_CMA,

					 gfp_mask);

		mutex_unlock(&cma_mutex);

        //5. 分配成功，就返回起始page

		if (ret == 0) {

			page = pfn_to_page(pfn);

			break;

		}

		cma_clear_bitmap(cma, pfn, count);

		if (ret != -EBUSY)

			break;

		pr_debug("%s(): memory range at %p is busy, retrying\n",

			 __func__, pfn_to_page(pfn));

		/* try again with a bit different memory target */

		start = bitmap_no + mask + 1;

	}

	trace_cma_alloc(pfn, page, count, align);

	if (ret && !(gfp_mask & __GFP_NOWARN)) {

		pr_info("%s: alloc failed, req-size: %zu pages, ret: %d\n",

			__func__, count, ret);

		cma_debug_show_areas(cma);

	}

	pr_debug("%s(): returned %p\n", __func__, page);

	return page;

}

CMA的释放

释放操作也很清晰，通过cma_release函数实现，会将页面释放回buddy系统，并将cma的bitmap相应bit清零：

bool cma_release(struct cma *cma, const struct page *pages, unsigned int count)

{

	unsigned long pfn;

	if (!cma || !pages)

		return false;

	pr_debug("%s(page %p)\n", __func__, (void *)pages);

	pfn = page_to_pfn(pages);

	if (pfn < cma->base_pfn || pfn >= cma->base_pfn + cma->count)

		return false;

	VM_BUG_ON(pfn + count > cma->base_pfn + cma->count);

	//释放回buddy

	free_contig_range(pfn, count);

	//清零bit位，表示对应cma内存可用

	cma_clear_bitmap(cma, pfn, count);

	trace_cma_release(pfn, pages, count);

	return true;

}

CMA与buddy

后续补充

【内存管理】CMA内存分配器（Contiguous Memory Allocator）的更多相关文章

[内存管理]连续内存分配器(CMA)概述
作者:Younger Liu, 本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 未本地化版本许可协议进行许可. 原文地址:http://lwn.net/Articles/396657/ 1 ...
启动期间的内存管理之引导分配器bootmem--Linux内存管理(十)
在内存管理的上下文中, 初始化(initialization)可以有多种含义. 在许多CPU上, 必须显式设置适用于Linux内核的内存模型. 例如在x86_32上需要切换到保护模式, 然后内核才能检 ...
Linux内存管理之bootmem分配器
为什么要使用bootmem分配器,内存管理不是有buddy系统和slab分配器吗?由于在系统初始化的时候需要执行一些内存管理,内存分配的任务,这个时候buddy系统,slab分配器等并没有被初始化好, ...
SAP专家培训之Netweaver ABAP内存管理和内存调优最佳实践
培训者:SAP成都研究院开发人员Jerry Wang 1. Understanding Memory Objects in ABAP Note1: DATA itab WITH HEADER LINE ...
Linux内存管理之slab分配器
slab分配器是什么? 参考:http://blog.csdn.net/vanbreaker/article/details/7664296 slab分配器是Linux内存管理中非常重要和复杂的一部分 ...
Linux内存管理 (5)slab分配器
专题:Linux内存管理专题关键词:slab/slub/slob.slab描述符.kmalloc.本地/共享对象缓冲池.slabs_partial/slabs_full/slabs_free.ava ...
Linux内核笔记——内存管理之slab分配器
内核版本:linux-2.6.11 内存区和内存对象伙伴系统是linux用于满足对不同大小块内存分配和释放请求的解决方案,它为slab分配器提供页框分配请求的实现. 如果我们需要请求具有连续物理地址 ...
Android内存管理机制之一：low memory killer
转载自http://www.miui.com/thread-29268-1-1.html 准备写这个专题之前,心里是有点忐忑的.首先Android内存管理机制相当复杂,想要讲清楚比较困难:其次对于绝大 ...
内存管理之slab分配器
基本思想与传统的内存管理模式相比, slab 缓存分配器提供了很多优点.首先,内核通常依赖于对小对象的分配,它们会在系统生命周期内进行无数次分配.slab 缓存分配器通过对类似大小的对象进行缓存而提 ...
启动期间的内存管理之bootmem_init初始化内存管理–Linux内存管理(十二)
1. 启动过程中的内存初始化首先我们来看看start_kernel是如何初始化系统的, start_kerne定义在init/main.c?v=4.7, line 479 其代码很复杂, 我们只截取 ...

随机推荐

COM三大接口:IUnknown、IClassFactory、IDispatch。
(1)COM组件有三个最基本的接口类,分别是IUnknown.IClassFactory.IDispatch. COM规范规定任何组件.任何接口都必须从IUnknown继承,IUnknown包含三个函 ...
elasticSearch(四)--结构化查询
结构化查询 1.请求体查询 GET(POST) /_search POST /_search { "from": 30, "size": 10 } 2.DSL ...
C# Linq不同类型数组之间的转换
string[] strArray = "a,b,c,d,e,f,g".Split(new char[]{ ',' }); int[] intArray; //C# 3.0下用此句 ...
div css 页面中心弹窗窗口
<head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8&quo ...
怎么解决CMD下执行Go出现中文乱码问题?
目录 1.报错信息如下 2.原因分析 3.解决方法 4.封装处理乱码方法 5.解决乱码完整代码 1.报错信息如下 2.原因分析因为Go的编码是UTF-8,而CMD的活动页是cp936(GBK),因此 ...
Flutter开发备用网站地址
Flutter开发之环境配置_移动开发_System.o的博客-CSDN博客: https://blog.csdn.net/lyh1299259684/article/details/80505185 ...
mysql 1130报错只允许localhost登录解决方法
提示:这些方法会改变登录权限,如果是生产服务器端谨慎操作!!! mysql出现错误码1130的解决办法: 错误描述: 错误代码:1130Host ***.***.***.*** is not allo ...
ubuntu18.04.3新装系统安装QT5.14.1和环境配置
第一步:下载QT: http://download.qt.io/archive/qt/ 或者 https://mirrors.tuna.tsinghua.edu.cn/qt/archive/qt/ 下 ...
OSI网络七层模型简明教程
如果你读过计算机专业,或者学习过网络通信,那你一定听说过 OSI 模型,它曾无数次让你头大.OSI 是 Open System Interconnection 的缩写,译为"开放式系统互联& ...
prophet安装（ubuntu16 python3.6）
ubuntu16 python3.6 (ubuntu16自带的python3是3.5 升级至3.6可参考https://blog.csdn.net/weixin_42544006/article/de ...

【内存管理】CMA内存分配器（Contiguous Memory Allocator）

什么是CMA

CMA的初始化创建

* 默认cma创建（dma_contiguous_default_area），两种方式：

*其他CMA区创建

CMA区域释放给buddy

CMA的分配

CMA的释放

CMA与buddy

【内存管理】CMA内存分配器（Contiguous Memory Allocator）的更多相关文章

随机推荐

热门专题