DPDK内存管理-----（二）rte

DPDK以两种方式对外提供内存管理方法，一个是rte_mempool，主要用于网卡数据包的收发；一个是rte_malloc，主要为应用程序提供内存使用接口。本文讨论rte_mempool。rte_mempool由函数rte_mempool_create()负责创建，从rte_config.mem_config->free_memseg[]中取出合适大小的内存，放到rte_config.mem_config->memzone[]中。

本文中，以l2fwd为例，说明rte_mempool的创建及使用。

一、rte_mempool的创建

 l2fwd_pktmbuf_pool =

     rte_mempool_create("mbuf_pool", NB_MBUF,

                MBUF_SIZE, ,

                sizeof(struct rte_pktmbuf_pool_private),

                rte_pktmbuf_pool_init, NULL,

                rte_pktmbuf_init, NULL,

                rte_socket_id(), );

“mbuf_pool”：创建的rte_mempool的名称。

NB_MBUF：rte_mempool包含的rte_mbuf元素的个数。

MBUF_SIZE：每个rte_mbuf元素的大小。

 #define RTE_PKTMBUF_HEADROOM    128

 #define MBUF_SIZE (2048 + sizeof(struct rte_mbuf) + RTE_PKTMBUF_HEADROOM)

 #define NB_MBUF   8192

 struct rte_pktmbuf_pool_private {

     uint16_t mbuf_data_room_size; /**< Size of data space in each mbuf.*/

 };

rte_mempool由函数rte_mempool_create()负责创建。首先创建rte_ring，再创建rte_mempool，并建立两者之间的关联。

1、rte_ring_create()创建rte_ring无锁队列

 r = rte_ring_create(rg_name, rte_align32pow2(n+), socket_id, rg_flags);

　　具体步骤如下：

　　a、需要保证创建的队列数可以被2整除，即，count = rte_align32pow2(n + 1);

　　b、计算需要为count个队列分配的内存空间，即，ring_size = count * sizeof(void *) + sizeof(struct rte_ring);

　　struct rte_ring的数据结构如下，

 struct rte_ring {

     TAILQ_ENTRY(rte_ring) next;      /**< Next in list. */

     char name[RTE_RING_NAMESIZE];    /**< Name of the ring. */

     int flags;                       /**< Flags supplied at creation. */

     /** Ring producer status. */

     struct prod {

         uint32_t watermark;      /**< Maximum items before EDQUOT. */

         uint32_t sp_enqueue;     /**< True, if single producer. */

         uint32_t size;           /**< Size of ring. */

         uint32_t mask;           /**< Mask (size-1) of ring. */

         volatile uint32_t head;  /**< Producer head. */

         volatile uint32_t tail;  /**< Producer tail. */

     } prod __rte_cache_aligned;

     /** Ring consumer status. */

     struct cons {

         uint32_t sc_dequeue;     /**< True, if single consumer. */

         uint32_t size;           /**< Size of the ring. */

         uint32_t mask;           /**< Mask (size-1) of ring. */

         volatile uint32_t head;  /**< Consumer head. */

         volatile uint32_t tail;  /**< Consumer tail. */

 #ifdef RTE_RING_SPLIT_PROD_CONS

     } cons __rte_cache_aligned;

 #else

     } cons;

 #endif

 #ifdef RTE_LIBRTE_RING_DEBUG

     struct rte_ring_debug_stats stats[RTE_MAX_LCORE];

 #endif

     void * ring[] __rte_cache_aligned; /**< Memory space of ring starts here.

                                          * not volatile so need to be careful

                                          * about compiler re-ordering */

 };

　　c、调用rte_memzone_reserve()，在rte_config.mem_config->free_memseg[]中查找一个合适的free_memseg（查找规则是free_memseg中剩余内存大于等于需要分配的内存，但是多余的部分是最小的），从该free_memseg中分配指定大小的内存，然后将分配的内存记录在rte_config.mem_config->memzone[]中。

　　d、初始化新分配的rte_ring。

 r->flags = flags;

 r->prod.watermark = count;

 r->prod.sp_enqueue = !!(flags & RING_F_SP_ENQ);

 r->cons.sc_dequeue = !!(flags & RING_F_SC_DEQ);

 r->prod.size = r->cons.size = count;

 r->prod.mask = r->cons.mask = count-;

 r->prod.head = r->cons.head = ;

 r->prod.tail = r->cons.tail = ;

 TAILQ_INSERT_TAIL(ring_list, r, next); // 挂到rte_config.mem_config->tailq_head[RTE_TAILQ_RING]队列中

2、创建并初始化rte_mempool

　　a、计算需要为rte_mempool申请的内存空间。包含：sizeof(struct rte_mempool)、private_data_size，以及n * objsz.total_size。

 mempool_size = MEMPOOL_HEADER_SIZE(mp, pg_num) + private_data_size;

 if (vaddr == NULL)

     mempool_size += (size_t)objsz.total_size * n;

　　objsz.total_size = objsz.header_size + objsz.elt_size + objsz.trailer_size; 其中，

　　objsz.header_size = sizeof(struct rte_mempool *);

　　objsz.elt_size = MBUF_SIZE；

　　objsz.trailer_size = ????

　　b、调用rte_memzone_reserve()，在rte_config.mem_config->free_memseg[]中查找一个合适的free_memseg，在该free_memseg中分配mempool_size大小的内存，然后将新分配的内存记录到rte_config.mem_config->memzone[]中。

　　c、初始化新创建的rte_mempool，并调用rte_pktmbuf_pool_init()初始化rte_mempool的私有数据结构。

 /* init the mempool structure */

 mp = mz->addr;

 memset(mp, , sizeof(*mp));

 snprintf(mp->name, sizeof(mp->name), "%s", name);

 mp->phys_addr = mz->phys_addr;

 mp->ring = r;

 mp->size = n;

 mp->flags = flags;

 mp->elt_size = objsz.elt_size;

 mp->header_size = objsz.header_size;

 mp->trailer_size = objsz.trailer_size;

 mp->cache_size = cache_size;

 mp->cache_flushthresh = (uint32_t)

     (cache_size * CACHE_FLUSHTHRESH_MULTIPLIER);

 mp->private_data_size = private_data_size;

 /* calculate address of the first element for continuous mempool. */

 obj = (char *)mp + MEMPOOL_HEADER_SIZE(mp, pg_num) +

     private_data_size;

 /* populate address translation fields. */

 mp->pg_num = pg_num;

 mp->pg_shift = pg_shift;

 mp->pg_mask = RTE_LEN2MASK(mp->pg_shift, typeof(mp->pg_mask));

 /* mempool elements allocated together with mempool */

 mp->elt_va_start = (uintptr_t)obj;

 mp->elt_pa[] = mp->phys_addr +

     (mp->elt_va_start - (uintptr_t)mp);

 mp->elt_va_end = mp->elt_va_start;

 RTE_EAL_TAILQ_INSERT_TAIL(RTE_TAILQ_MEMPOOL, rte_mempool_list, mp); //挂到rte_config.mem_config->tailq_head[RTE_TAILQ_MEMPOOL]队列中

　　d、调用mempool_populate()，以及rte_pktmbuf_init()初始化rte_mempool的每个rte_mbuf元素。

3、总结

相关数据结构的关联关系如下图：

二、rte_mempool的调用

未完，待续。。。。

错误之处，欢迎指出。

DPDK内存管理-----（二）rte_mempool内存管理的更多相关文章

MySQL 调优基础(二) Linux内存管理
进程的运行,必须使用内存.下图是Linux中进程中的内存的分布图: 其中最重要的 heap segment 和 stack segment.其它内存段基本是大小固定的.注意stack是向低地址增长的, ...
你必须了解的java内存管理机制（二）-内存分配
前言在上一篇文章中,我们花了较大的篇幅去介绍了JVM的运行时数据区,并且重点介绍了栈区的结构及作用,相关内容请猛戳!在本文中,我们将主要介绍对象的创建过程及在堆中的分配方式. 相关链接(注:文章讲解 ...
《Linux内核设计与实现》读书笔记（十二）- 内存管理【转】
转自:http://www.cnblogs.com/wang_yb/archive/2013/05/23/3095907.html 内核的内存使用不像用户空间那样随意,内核的内存出现错误时也只有靠自己 ...
OC的内存管理(二)ARC
指针: 指向内存的地址指针变量存放地址的变量指针变量值变量中存放的值(地址值)指针变量指向的内存单元值内存地址指向的值1):强指针:默认的情况下,所有的指针都是强指针,关键字strong ):弱 ...
高端内存映射之kmap_atomic固定映射--Linux内存管理(二十一)
1 固定映射 1.1 数据结构 linux高端内存中的临时内存区为固定内存区的一部分, 对于固定内存在linux内核中有下面描述 x86 arm arm64 arch/x86/include/asm/ ...
Linux内存描述之内存节点node--Linux内存管理(二)
1 内存节点node 1.1 为什么要用node来描述内存这点前面是说的很明白了, NUMA结构下, 每个处理器CPU与一个本地内存直接相连, 而不同处理器之前则通过总线进行进一步的连接, 因此相对 ...
Linux内存描述之内存节点node–Linux内存管理(二)
日期内核版本架构作者 GitHub CSDN 2016-06-14 Linux-4.7 X86 & arm gatieme LinuxDeviceDrivers Linux内存管理 #1 ...
Block（二）内存管理与其他特性
一.block放在哪里我们针对不同情况来讨论block的存放位置: 1.栈和堆以下情况中的block位于堆中: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ...
Block（二）内存管理与其他特性-b
一.block放在哪里我们针对不同情况来讨论block的存放位置: 1.栈和堆以下情况中的block位于堆中: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 ...
高端内存映射之kmap持久内核映射--Linux内存管理(二十)
1 高端内存与内核映射尽管vmalloc函数族可用于从高端内存域向内核映射页帧(这些在内核空间中通常是无法直接看到的), 但这并不是这些函数的实际用途. 重要的是强调以下事实 : 内核提供了其他函数 ...

随机推荐

文件下载(只需要简单的四步)，Java中都通用
我们就直接切入主题啦,文件下载只需要四步: 1.设置文件ContentType类型 2.设置文件头 3.通过response获取ServletOutputStream对象(out) 4.写到输出流(o ...
Failed to create the java virtual machine完全解决办法
一直用EcliPSe开发java,突然有这么一天,无法启动了,splash窗口显示“Failed to create the Java Virtual Machine”,结果发现eclipse和mye ...
oracle 游标笔记
declare v_x number; v_y number; v_geo clob; cursor cur is select c_x, c_y from t_map_data where c_ty ...
Android--创建进度框ProgressDialog
1.布局文件progress_dialog_activity.xml <?xml version="1.0" encoding="utf-8"?> ...
Arch xfce4 安装解压缩软件
>>>安装方法 pacman -S thunar-archive-plugin xarchiver zip unzip p7zip arj lzop cpio unrar >& ...
mysql 使用说明-3
3.4 Getting Information About Databases and Tables 获取数据库和表格的信息如果你忘记了数据库或者表格的名字怎么办?或者给定的表格的结构怎么办?(例如 ...
动手学servlet(一) 第一个servlet程序
1.文件>新建>动态WEB项目 "javaeedemo">在Java Resource的src下新建包“servletdemo”,包下新建一个类“MyServet ...
用imageNamed加载图片产生的问题
通常我们会用imageNamed:来加载图片,但是用这个API有个问题,就是它会缓存加载的image. 因此,对于那些被重用的图片,这个API很高效.但是对于那些使用很少的图片,用这个就很耗内存,那怎 ...
Android开发-API指南-Fragment
Fragments 英文原文:http://developer.android.com/guide/components/fragments.html 采集日期:2014-12-31 在本文中设计理 ...
发几个Flex的学习资源
书籍: 目前在看两本 <Essential.ActionScript.3.0> <Flex 4 In Action> 还有两本当手册翻阅,非常喜欢Cookbook这种题材的书, ...

DPDK内存管理-----（二）rte_mempool内存管理

DPDK内存管理-----（二）rte_mempool内存管理的更多相关文章

随机推荐

热门专题