有这样一个网络传输包。

前端有个固定的包头,包含了后面传输body的长度信息。

在有拷贝的前提下,我们选用什么性能比较高呢?
        方案一
        复用data_buffer string 将Header 头insert到data_buffer中,将大量的字符串后移定长。
        方案二
        将Header外化一个string,然后调用append函数,将data_buffer的字符拷贝到head的string中去。
        方案三
        分配内存,memcpy 过去。
        方案四
        不分配内存,利用栈空间(受限),memcpy过去。
        
        这四种方案那种的效率最高呢?我比较好奇,做了下实验(如无说明,已然-O2优化),测试代码参考
#include <string>
#include <stdio.h>
#include "Utility.h"
int load_file(const char* filename, char** content, size_t* content_len)
{
FILE* fp = fopen(filename, "r");
if (!fp)
{
return -;
}
fseek(fp, , SEEK_END);
size_t len = ftell(fp);
rewind(fp);
char* buf = (char*)malloc(len + );
if (!buf)
{
return -;
}
fread(buf, sizeof(char), len, fp);
buf[len] = '\0';
fclose(fp);
*content = buf;
*content_len = len;
return ;
} int main(int argc, const char *argv[])
{
char* content;
const char* file_name = argv[];
uint32_t space = atoi(argv[]);
uint32_t insert = atoi(argv[]);
size_t len = ;
if (load_file(file_name, &content, &len) < )
{
printf("load %s failed\n", file_name);
return -;
}
std::string raw_content(content, len);
for (int i = ; i < space - ; i++)
{
raw_content.append(content, len);
}
char size_str[];
snprintf(size_str, sizeof(size_str), "%u\t%u",
insert, raw_content.size());
std::string final_content("cooooooo%dddd$%DDD123r423");
{
TimeEval timer(size_str);
if(insert == )
{
raw_content.insert(, final_content);
} if (insert == )
{
final_content.append(raw_content);
}
if (insert == )
{
char* buf = (char*)malloc(final_content.size() + raw_content.size() + );
memcpy(buf, final_content.c_str(), final_content.size());
memcpy(buf + final_content.size(), raw_content.c_str(), raw_content.size());
free(buf);
}
}
return ;
}

性能测试显示

可以看到在insert移动文本长度在k 级别以上时,其效率较拷贝的效率高得多。

个人觉得原因有两个
1)cache
      大数据如果已然cache住,往里面拷贝小数据比较快。
      如果生成两份大数据,往变量中拷贝,cache的可能性要小,程序的局部性变低。
2)内存分配
     通过gcc的代码append 一个大数据,和insert一份小数据,append分配内存空间的可能性要大得多。

由于涉及到内存分配,方案3的效率最低。

方案1 和方案2 的性能差别应该以上由于方案二分配了大量的(标红处)内存空间,gcc的代码如下

结论:
       1. 分配和空间拷贝数据是比较耗时的。在程序中应该尽量减少内存分配。
       2. 如果需要拷贝,则尽量拷贝将小数据拷贝到大数据处,而不是相反。
     

string insert 的性能分析的更多相关文章

  1. Java 集合系列08之 List总结(LinkedList, ArrayList等使用场景和性能分析)

    概要 前面,我们学完了List的全部内容(ArrayList, LinkedList, Vector, Stack). Java 集合系列03之 ArrayList详细介绍(源码解析)和使用示例 Ja ...

  2. Java 集合系列 07 List总结(LinkedList, ArrayList等使用场景和性能分析)

    java 集合系列目录: Java 集合系列 01 总体框架 Java 集合系列 02 Collection架构 Java 集合系列 03 ArrayList详细介绍(源码解析)和使用示例 Java ...

  3. MyBatisPlus性能分析插件,条件构造器,代码自动生成器详解

    性能分析插件 我们在平时的开发中,会遇到一些慢sql,测试,druid MP(MyBatisPlus)也提供性能分析插件,如果超过这个时间就停止 不过官方在3.2版本的时候取消了,原因如下 条件构造器 ...

  4. SQL Server-聚焦IN VS EXISTS VS JOIN性能分析(十九)

    前言 本节我们开始讲讲这一系列性能比较的终极篇IN VS EXISTS VS JOIN的性能分析,前面系列有人一直在说场景不够,这里我们结合查询索引列.非索引列.查询小表.查询大表来综合分析,简短的内 ...

  5. SQL Server-聚焦NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL性能分析(十八)

    前言 本节我们来综合比较NOT IN VS NOT EXISTS VS LEFT JOIN...IS NULL的性能,简短的内容,深入的理解,Always to review the basics. ...

  6. SQL Server-聚焦EXISTS AND IN性能分析(十六)

    前言 前面我们学习了NOT EXISTS和NOT IN的比较,当然少不了EXISTS和IN的比较,所以本节我们来学习EXISTS和IN的比较,简短的内容,深入的理解,Always to review ...

  7. SQL Server-聚焦INNER JOIN AND IN性能分析(十四)

    前言 本节我们来讲讲联接综合知识,我们在大多教程或理论书上都在讲用哪好,哪个性能不如哪个的性能,但是真正讲到问题的实质却不是太多,所以才有了本系列每一篇的篇幅不是太多,但是肯定是我用心去查找许多资料而 ...

  8. 性能分析神器VisualVM

    VisualVM 是一款免费的,集成了多个 JDK 命令行工具的可视化工具,它能为您提供强大的分析能力,对 Java 应用程序做性能分析和调优.这些功能包括生成和分析海量数据.跟踪内存泄漏.监控垃圾回 ...

  9. MySQL性能分析及explain的使用

    MySQL性能分析及explain用法的知识 1.使用explain语句去查看分析结果 如explain select * from test1 where id=1;会出现:id  selectty ...

随机推荐

  1. ListView(2)最简单的上拉刷新,下拉刷新

    最简单的上拉刷新和下拉刷新,当listview滚动到底部时向上拉刷新数据.当listview滚动到最顶部时下拉刷新.       图1,上拉刷新 图2,下拉刷新 1,设置lisview,加载heade ...

  2. Windows 7下配置JDK环境变量和Java环境变量配置

    下面来介绍一下Java环境变量配置,是在Windows 7下配置JDK环境变量. 方法/步骤  1 安装JDK,安装过程中可以自定义安装目录等信息,例如我们选择安装目录为:C:\Program Fil ...

  3. python 字符串换行的三种方式

    if __name__ == '__main__': #第一种: 三个单引号 print ''' aaaaaaaaaaaaaaaa         bbbbbbbbbbbbbb''' #第二种: 三个 ...

  4. awk输出单引号,双引号

    双引号: awk '{print "\""}'        #放大:awk '{print "  \"  "}' 使用“”双引号把一个双引 ...

  5. [HDOJ2795]Billboard(线段树,单点更新)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2795 题意:w*h的公告板要贴公告,公告是w*1的,每个公告有先后顺序,要使每个公告贴的位置尽可能地高 ...

  6. BZOJ 1000: A+B Problem

    问题:A + B问题 描述:http://acm.wust.edu.cn/problem.php?id=1000&soj=0 代码示例: import java.util.Scanner; p ...

  7. Java关键字static、final使用小结

    static  1. static变量     按照是否静态的对类成员变量进行分类可分两种:一种是被static修饰的变量,叫静态变量或类变量:另一种是没有被static修饰的变量,叫实例变量.两者的 ...

  8. 函数 xdes_get_descriptor_with_space_hdr

    获得区描述符 xdes entry 的offset /********************************************************************//** ...

  9. LA 4636 (贪心) Cubist Artwok

    题意: 一个由若干小正方体组成的图形,给出它的正视图和侧视图,求满足条件的最少小正方体的个数. 分析: 虽说是一道简单的贪心,可一直没有太好的思路. 又一次可耻地看了别人的题解. http://blo ...

  10. 为什么多数游戏服务端是用 C++ 来写

    早年开发游戏必须用C++,这没得说,2000-2004年,java还没有nio,其他动态语言不抗重负,只能C/C++能开发出完整可用的游戏服务端.直到2005年,韩国的游戏很多都还是纯C++写服务端, ...