如何实现一个malloc函数

一、概述

1、malloc简介

函数所在头文件：<stdlib.h>

函数原型是：void *malloc (size_t n)

函数功能：在内存的动态存储区中分配一个长度为size的连续空间。其参数是一个无符号整形数，返回值是一个指向所分配的连续存储域的起始地址的指针。

2、malloc函数使用注意事项

申请了内存空间后，必须检查是否分配成功。
当不需要再使用申请的内存时，记得释放；释放后应该把指向这块内存的指针指向NULL，防止程序后面不小心使用了它。
malloc和free函数应该配对使用。如果申请后不释放，就是内存泄露；如果无故释放那就是什么也没有做。释放只能一次，如果释放两次及两次以上会出现错误。
越界使用动态分配的存储块，尤其是越界赋值，可能引起非常严重的后果，通常会破坏程序的运行系统，可能造成本程序或者整个计算机系统垮台。

3、本文的目的

　　一直很想亲手实现一个malloc函数，不仅仅是锻炼自己的编程能力，对指针的驾驭能力，而且也是为了解除自己对malloc函数的疑惑--为什么使用malloc函数有上述的注意事项？要想知道原因，只有自己查阅源码，或者自己编写功能类似的源码，而笔者选用了后者。

二、本程序实现机制

1、块控制头部

　　块控制头部结构体定义如下所示：

typedef struct{

unsigned char is_available;         /* whether blcok is avaiable */

unsigned int prior_blocksize;       /* size of prior block */

unsigned int current_blocksize;     /* block size */

}mem_control_block;

　　每申请一个内存空间，无论大小（char、short、long）都将其命名为"Block"。在分配一个Block的时候，在堆区（heap）首先存放的是Block的控制块，然后才是有效的数据区。可以想象，假设我们申请一个char型大小的空间，实际上在堆区占据了“sizeof(char)+sizeof(mem_control_block)”。就是通过Block的头部控制块将堆区连成一个链表，通过这个链表可以遍历整个堆区的每一个块。

　　is_avilable标记内存块是否被分配，是否可用。prior_blocksize保存了前一个块的大小，current_blocksize保存了当前块的实际有效数据空间大小。有了current_blocksize，我们可以从前向后遍历整个堆区；而有了prior_blocksize，我们可以从后向前遍历整个堆区。也就是说，这个控制块头部使我们为堆区建立了一个双向链表，以便于管理。

2、malloc

　　调用malloc函数时，它沿连接表从前向后，寻找一个没有被占用的，而且大到足以满足用户请求所需要的内存块。在寻找过程中，分三种情况。

　　第一种情况，倘若可用而且大小刚好合适，那么直接将此块返回就完成了分配。

　　第二种情况，倘若可用而且超过了所需要的内存块并且还能容纳一个新块的控制头部，这个时候就将此块一分为二。将分配给用户的那块内存的is_available置0（不再可用），然后将此块的有效数据区首地址作为函数值返回。而新块的控制头部要进行赋值（只有含有头部的块才能称的上一个块），没有控制头部的块不能进行管理。

　第三种情况，倘若可用内存块的空间小于需要的空间，或者虽然超过了但是不能腾出一个控制头部，最终的处理都是跳过改块，移动到链表的下一块进行新一轮的比较。

3、free

　　free函数用于内存块的回收，当不用的内存块调用此函数释放空间的时候，将is_available置1（可以重新分配）。接下来要做的就是整合内存碎片。由于可能多次malloc函数，产生了很多的内存碎片，在释放一个块的时候，不仅要标记此块为“可用”。另外，还需要试着将此块前后的块进行合并，这样才能为将来申请更大的空间做好准备。

4、malloc_init

　　初始化函数，主要是确定堆区的起始位置、大小和结束地址，也就是确定堆区的边界。我们申请的内存块必须在堆区内，不得超出边界，否则会修改其他的数据。

　　另外，还需要对堆区进行初始化，建立第一个内存块（初始化头部控制结构体）。显然，这个块是一个完整的块，也是一次能分配最大内存空间的块。之所以进行初始化，原因还是没有头部控制结构体的块无法进行管理。

三、代码及解释

1、malloc_init

 /**

   * @brief Initializes malloc's gloabl varialbe and head of heap memory

   * @param None

   * @retval None

   */

 void malloc_init(void)

 {

     mem_control_block * mcb = NULL;

     /* confirm heap's start address */

     managed_memory_start = (unsigned int)malloc_addr;

     /* confirm heap's size */

     managed_memory_size = malloc_size;

     /*confirm heap's end address */

     managed_memory_end = managed_memory_start + managed_memory_size;

     /* make mcb point to heap's start address */

     mcb = (mem_control_block *)managed_memory_start;

     /*the first blcok is avaialbe */

     mcb->is_available = ;

     /*there is no block before the first block */

     mcb->prior_blocksize = ;

     /*the first block's block size is difference of between heap's size and control block */

     mcb->current_blocksize = managed_memory_size - sizeof(mem_control_block);

     /* Initialize done */

     has_initialized = ;

 }

2、malloc

 /**

   * @brief Dynamic distribute memory function

   * @param numbytes: what size you need

   * @retval a void pointer to the distribute first address

   */

 void * malloc(unsigned int numbytes)

 {

     unsigned int current_location,otherbck_location;

     /* This is the same as current_location, but cast to a memory_control_block */

     mem_control_block * current_location_mcb = NULL,* other_location_mcb = NULL;

     /* varialbe for saving return value and be set to 0 until we find something suitable */

     void * memory_location = NULL;

     /* current dividing block size */

     unsigned int process_blocksize;

     /* Initialize if we haven't already done so */

     if(! has_initialized) {

         malloc_init();

     }

     /* Begin searching at the start of managed memory */

     current_location = managed_memory_start;

     /* Keep going until we have searched all allocated space */

     while(current_location != managed_memory_end){

         /* current_location and current_location_mcb point to the same address.  However,

          * current_location_mcb is of the correct type, so we can use it as a struct. current_location

          * is a void pointer so we can use it to calculate addresses.

          */

         current_location_mcb = (mem_control_block *)current_location;

         /* judge whether current block is avaiable */

         if(current_location_mcb->is_available){

             /* judge whether current block size exactly fit for the need */

             if((current_location_mcb->current_blocksize == numbytes)){

                 /* It is no longer available */

                 current_location_mcb->is_available = ;

                 /* We own it */

                 memory_location = (void *)(current_location + sizeof(mem_control_block));

                 /* Leave the loop */

                 break;

             /* judge whether current block size is enough for dividing a new block */

             }else if(current_location_mcb->current_blocksize >= numbytes + sizeof(mem_control_block)){

                 /* It is no longer available */

                 current_location_mcb->is_available = ;

                 /* because we will divide current blcok,before we changed current block size,we should

                  * save the integral size.

                  */

                 process_blocksize = current_location_mcb->current_blocksize;

                 /* Now blcok size could be changed */

                 current_location_mcb->current_blocksize = numbytes;

                 /* find the memory_control_block's head of remaining block and set parameter,block of no

                  * parameter can't be managed.

                  */

                 other_location_mcb = (mem_control_block *)(current_location + numbytes \

                                                 + sizeof(mem_control_block));

                 /* the remaining block is still avaiable */

                 other_location_mcb->is_available = ;

                 /* of course,its prior block size is numbytes */

                 other_location_mcb->prior_blocksize = numbytes;

                 /* its size should get small */

                 other_location_mcb->current_blocksize = process_blocksize - numbytes \

                                                 - sizeof(mem_control_block);

                 /* find the memory_control_block's head of block after current block and \

                  * set parameter--prior_blocksize.

                  */

                 otherbck_location = current_location + process_blocksize \

                                             + sizeof(mem_control_block);

                 /* We need check wehter this block is on the edge of managed memeory! */

                 if(otherbck_location != managed_memory_end){

                     other_location_mcb = (mem_control_block *)(otherbck_location);

                     /*  its prior block size has changed! */

                     other_location_mcb->prior_blocksize = process_blocksize\

                         - numbytes - sizeof(mem_control_block);

                 }

                 /*We own the occupied block ,not remaining block */

                 memory_location = (void *)(current_location + sizeof(mem_control_block));

                 /* Leave the loop */

                 break;

             }

         }

         /* current block is unavaiable or block size is too small and move to next block*/

         current_location += current_location_mcb->current_blocksize \

                                     + sizeof(mem_control_block);

     }

     /* if we still don't have a valid location,we'll have to return NULL */

     if(memory_location == NULL)    {

         return NULL;

     }

     /* return the pointer */

     return memory_location;

 }

此函数流程图

3、free

 /**

   * @brief  free your unused block

   * @param  firstbyte: a pointer to first address of your unused block

   * @retval None

   */

 void free(void *firstbyte)

 {

     unsigned int current_location,otherbck_location;

     mem_control_block * current_mcb = NULL,* next_mcb = NULL,* prior_mcb \

                                 = NULL,* other_mcb = NULL;

     /* Backup from the given pointer to find the current block */

     current_location = (unsigned int)firstbyte - sizeof(mem_control_block);

     current_mcb = (mem_control_block *)current_location;

     /* Mark the block as being avaiable */

     current_mcb->is_available = ;

     /* find next block location */

     otherbck_location = current_location + sizeof(mem_control_block) \

                                     + current_mcb->current_blocksize;

     /* We need check wehter this block is on the edge of managed memeory! */

     if(otherbck_location != managed_memory_end){

         /* point to next block */

         next_mcb = (mem_control_block *)otherbck_location;

         /* We need check whether its next block is avaiable */

         if(next_mcb->is_available){

             /* Because its next block is also avaiable,we should merge blocks */

             current_mcb->current_blocksize = current_mcb->current_blocksize \

                 + sizeof(mem_control_block) + next_mcb->current_blocksize;

             /* We have merge two blocks,so we need change prior_blocksize of

              * block after the two blocks,just find next block location.

              */

             otherbck_location = current_location + sizeof(mem_control_block) \

                                     + current_mcb->current_blocksize;

             /* We need check wehter this block is on the edge of managed memeory! */

             if(otherbck_location != managed_memory_end){

                 other_mcb = (mem_control_block *)otherbck_location;

                 /*  its prior block size has changed! */

                 other_mcb->prior_blocksize = current_mcb->current_blocksize;

             }

         }

     }

     /* We need check wehter this block is on the edge of managed memeory! */

     if(current_location != managed_memory_start){

         /* point to prior block */

         prior_mcb = (mem_control_block *)(current_location - sizeof(mem_control_block)\

                                             - current_mcb->prior_blocksize);

         /* We need check whether its prior block is avaiable */

         if(prior_mcb->is_available){

             /* Because its prior block is also avaiable,we should merge blocks */

             prior_mcb->current_blocksize = prior_mcb->current_blocksize \

                 + sizeof(mem_control_block) + current_mcb->current_blocksize;

             /* We have merge two blocks,so we need change prior_blocksize of

              * block after the two blocks,just find next block location.

              */

             otherbck_location = current_location + sizeof(mem_control_block) \

                                     + current_mcb->current_blocksize;

             /* We need check wehter this block is on the edge of managed memeory! */

             if(otherbck_location != managed_memory_end){

                 other_mcb = (mem_control_block *)otherbck_location;

                 /*  its prior block size has changed! */

                 other_mcb->prior_blocksize = prior_mcb->current_blocksize;

             }

         }

     }

 }

知乎：

　　释放一个已分配的数据块，只是对此数据块以及其前后数据块的控制块头部进行调整，并没有对实际有效数据区域（用户可见的区域）进行初始化操作，也就是说数据区域中的数据保持不变。

四、实现过程中易出现的Bug

　　我们管理堆，靠的就是头部控制块。不管是分配还是释放，都是通过修改头部控制块的信息来实现堆链表的改变，从而达到从堆区中分配一块内存空间给用户，或者将一个内存块释放为重新可用。分配过程中的将大块一分为二，其实就是增加一个控制块头部；释放过程中的将两个连续可用块合并到一起，实际上就是减少一个控制块头部。

　　堆栈的分配和释放，在我们改变堆栈控制头部的信息之前，一定要检查块是否是已经位于堆区之外（如果你确定这个块一定在堆内，可以省去检查代码）。倘若不去核查，而直接更改堆内存数据，有可能会更改堆区之外的数据，这是非常危险的。

五、测试结果

1、初始化建立第一个块成功

2、支持在第一个块上分割出一个用户块

3、用户块释放之后，可以和前后的可用块合并

4、释放后的块可以重新用于分配

5、支持在一个大的可用块中分出一个较小的用户块，伴随着一个新的较小块的产生

6、找不到合适的块分配给用户了，返回空地址

六、目前本程序的应用以及展望

1、目前本程序的应用

　　操作系统的动态分配内存函数malloc的实现方法与本文差别还是很大的。目前本程序不支持操作系统的动态内存分配，但是可以在单片机的动态内存管理上使用。

　　使用方法就是一开始为单片机定义一个固定位置、固定大小的堆区，然后将堆区的起始地址和大小作为宏参数传递给Rewrite_malloc_init函数中，并进行初始化。接下来，就可以调用malloc和free对内存进行动态分配和管理。

2、展望

　　本程序的malloc函数，在没有足够的堆空间分配给用户时，就直接以NULL返回给用户。如果可能的话，在操作系统中，可以继续从操作系统中申请堆空间（sbrk函数），然后再进行分配。　

七、探秘malloc函数使用注意事项

1、使用malloc函数，注意对不用的空间进行释放

　　显然，每申请一个用户空间都会引起可用堆区的减少。如果只申请不释放，就会导致可用堆区不断减少，到最后有可能就没有空间分配给新的用户需要。

2、释放只能一次，重复释放有可能产生错误

　　多次释放同一用户空间，有可能不会出现错误；但是，也有可能会出现错误。也就是说，多次释放产生的结果是难以预测的。下面展示一个错误的释放例程。

/**

  * @brief Test malloc function

  * @param None

  * @retval int

  */

int main(void)

{

    int * p1,* p2,* p3;

    memset((void *)heap,,HEAPSIZE);

    malloc_init();

    p1 = (int *)malloc(sizeof(int));

    p2 = (int *)malloc(sizeof(int));

    p3 = (int *)malloc(sizeof(int)); 

    free((void *)p2);

    free((void *)p1);

    free((void *)p2);

    while();

    return ;

}

解释：

　　可以肯定的是，p1、p2、p3这三个块对应的块大小都是相同的。一个块的大小，包含一个头部（sizeof(mem_control_block) = 12Byts）和有效数据区（4 Bytes），所以总共16个bytes。

　　当第一次释放p2的时候，p2控制块的is_avaialbe变为1（重新可用）。当释放p1的时候，会将p1和p2整合到一起，这个时候p2对应的块就被注销了（注意块头部的信息还在内存中，只不过p1的块大小变大，将来沿着链表遍历时，会将这个块跳过）。当再次释放p2的时候，由于控制头部信息还在，所以还会再进行一次p1和p2块的整合，结果将p1块的大小设置成更大的，而超出了p1块实际拥有的空间。

　　因此重复释放可能导致“块头部控制结构体”的错误修改，而导致块管理信息错误，丧失堆区管理功能。

参考资料：浅析malloc（）的几种实现方式

源码及VC6.0工程：malloc.zip

如何实现一个malloc函数的更多相关文章

关于malloc函数的动态分配问题
malloc函数动态分配了一个整型的内存空间,让abc都指向刚申请的空间,所以只有最后一个赋值语句的值保留在了空间里 #include<stdio.h> main() { int *a,* ...
转：如何实现一个malloc
如何实现一个malloc 转载后排版效果很差,看原文! 任何一个用过或学过C的人对malloc都不会陌生.大家都知道malloc可以分配一段连续的内存空间,并且在不再使用时可以通过free释放掉. ...
malloc 函数工作机制(转)
malloc()工作机制 malloc函数的实质体现在,它有一个将可用的内存块连接为一个长长的列表的所谓空闲链表.调用malloc函数时,它沿连接表寻找一个大到足以满足用户请求所需要的内存块.然后,将 ...
malloc函数详解
一.原型:extern void *malloc(unsigned int num_bytes); 头文件:#include <malloc.h> 或 #include <alloc ...
malloc 函数到底做了什么？
请看下面的代码. 猜测结果是什么?编译通过吗? #include <stdio.h> #include <stdlib.h> int main() { ; char *ptr ...
malloc函数和其他内存分配函数
1. 需要包含头文件:#i nclude 或 #i nclude 函数声明(函数原型): void *malloc(int size); 说明:malloc 向系统申请分配指定size个字节的内存空间 ...
如何实现一个malloc
任何一个用过或学过C的人对malloc都不会陌生.大家都知道malloc可以分配一段连续的内存空间,并且在不再使用时可以通过free释放掉.但是,许多程序员对malloc背后的事情并不熟悉,许多人甚至 ...
malloc函数
C语言中,使用malloc函数向内存中动态申请空间. 函数的原型是extern void *malloc(unsigned int num_bytes); 可见,函数返回的是指针类型,参数是要申请的空 ...
malloc函数的底层实现你是否清楚
malloc函数的底层实现你是否清楚说起malloc函数,每个人都能说出它的功能,而且我们经常会用到,那么今天我要说的是关于malloc函数在编译器的底层实现,如果你对它的实现已经很清楚了,那么你可 ...

随机推荐

聊一聊ES5数组（Array）新增的那些方法
一.前言 ES5中新增的一些处理数组(Array)的方法, 对于用JavaScript处理数据非常有用.我总结了一下,给这些方法分了类,大体如下: 2个索引方法:indexOf() 和 lastInd ...
Spring3之MVC
模式-视图-控制器(MVC)是UI设计中常见的设计模式, 该模式区分应用程序中的模式.视图和控制器三个角色,消除了业务逻辑与UI的耦合.模式负责封装视图展示的应用数据.视图应该只显示数据,不包含任何业 ...
Android drawable里面的图片存在，但是getIdentifier或者findViewByid找不到时处理步骤
drawable里面的图片存在,但是getIdentifier或者findViewByid找不到时执行一下project -> clean
绿荫工作室爱选修app内测
下载地址:http://greendasungta.com/greencms/ixuanxiu.apk 开发目的是用于方便在校生的选课操作以及对选修课的交流.
Android_Spinner_example
xml数据: <RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns ...
C#总结2
第三章对于继承:继承是根据父类创建新子类的过程: 对于继承:例: Public class Father { public void say() { //dosomething } } Pu ...
c# 远程监控（4）接收端 RTP包重组分屏显示
我们在上一期使用RTP协议,并进行了配置,打包了视频数据,这一期我们就对发送的数据进行重组,并显示在接受端上.最后对其进行扩展,支持多客户端视频发送,并在接收端分屏显示.完成远程监控的模拟. 先来个效 ...
HW--漂亮度2（测试通过）
总结:几个函数的使用 (1) int num=Integer.parseInt(str[0]); //将第一个字符串转成整形数,表示名字个数 (2) String string1=str[i].to ...
AWK 脚本编写习惯
教训总结: 不能忽略了脚本语言的编写规范! 创建数组的时候初始化,特别是在for循环中使用的数组: u_count[; g_count[; 认真对待对象,特别是数组的命名: username_to_d ...
第十二篇、高度自适应的textView
高度根据输入内容变化输入框,我们在很多的应用上都可以见到,如微信.QQ聊天,QQ空间评论等等,该输入框可以用xib,纯代码编写,但是个人觉得纯代码编写用起来更加方便一些. 1.使用自定义的UIView ...

如何实现一个malloc函数

如何实现一个malloc函数的更多相关文章

随机推荐

热门专题