C++ 性能反向优化——用哈希表unordered_map消除if else导致性能降低。

从代码整洁的角度考虑，对于不同的值将调用相同参数的不同函数，我们通常可以通过建立从值到对应函数指针的哈希表，从而将if else消除。但实际可能使性能更低，以下是测试例子。

原因在于，if else分支预测不正确虽然可能使指令流水线几条指令执行错误，但通过哈希表的方式，增加了计算哈希值、查询哈希表以及通过函数指针调用的开销，从而可能使得调用过程慢了更多。

以下比较了四种方法的计算性能：

if else
unordered_map
switch case
function pointer array

#include <iostream>

#include <bits/stdc++.h>

using namespace std;

constexpr int N = 10;

constexpr int COUNT = 10000000;

long long a = 0;

void targetFunc1(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

void targetFunc2(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

void targetFunc3(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

void targetFunc4(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

void targetFunc5(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

void targetFunc6(){

	for(int i = 0; i < N; i++){

		a++;

	}

}

// 1. if else

void test1(int a){

	if(a == 1) targetFunc1();

	if(a == 2) targetFunc2();

	if(a == 3) targetFunc3();

	if(a == 4) targetFunc4();

	if(a == 5) targetFunc5();

	if(a == 6) targetFunc6();

}

std::unordered_map<int, void(*)()> funcs = {

	{1, targetFunc1},

	{2, targetFunc2},

	{3, targetFunc3},

	{4, targetFunc4},

	{5, targetFunc5},

	{6, targetFunc6}

};

// 2. unordered_map

void test2(int a){

	funcs[a]();

}

// 3. switch case

void test3(int a){

	switch(a){

		case 1:

			targetFunc1();

			break;

		case 2:

			targetFunc2();

			break;

		case 3:

			targetFunc3();

			break;

		case 4:

			targetFunc4();

			break;

		case 5:

			targetFunc5();

			break;

		case 6:

			targetFunc6();

			break;

	}

}

// 4. function pointer array

void (*arr[6])();

void test4(int a){

	arr[a-1]();

}

void timeMeasure(void(*f)(int)){

    auto begin = std::chrono::high_resolution_clock::now();

    uint32_t iterations = 100;

    for(uint32_t i = 0; i < iterations; ++i)

    {

		int index = rand() % 6 + 1;

		f(index);

    }

    auto end = std::chrono::high_resolution_clock::now();

    auto duration = std::chrono::duration_cast<std::chrono::nanoseconds>(end-begin).count();

    std::cout << duration << "ns total, average : " << duration / iterations << "ns." << std::endl;

}

int main()

{

	arr[0] = targetFunc1;

	arr[1] = targetFunc2;

	arr[2] = targetFunc3;

	arr[3] = targetFunc4;

	arr[4] = targetFunc5;

	arr[5] = targetFunc6;

	timeMeasure(test1);

	std::cout<<a<<std::endl;

	timeMeasure(test2);

	std::cout<<a<<std::endl;

	timeMeasure(test3);

	std::cout<<a<<std::endl;

	timeMeasure(test4);

	std::cout<<a<<std::endl;

	return 0;

}

16859ns total, average : 168ns.

1000

41576ns total, average : 415ns.

2000

13834ns total, average : 138ns.

3000

14368ns total, average : 143ns.

4000

结论：

switch case和函数指针数组查表比if else实现的性能较高
unordered_map查表导致性能降低。

C++ 性能反向优化——用哈希表unordered_map消除if else导致性能降低。的更多相关文章

[PHP内核探索]PHP中的哈希表
在PHP内核中,其中一个很重要的数据结构就是HashTable.我们常用的数组,在内核中就是用HashTable来实现.那么,PHP的HashTable是怎么实现的呢?最近在看HashTable的数据 ...
【算法】哈希表的诞生（Java）
参考资料 <算法(java)> — — Robert Sedgewick, Kevin Wayne <数据结构> ...
性能调优7：多表连接 - join
在产品环境中,往往存在着大量的表连接情景,不管是inner join.outer join.cross join和full join(逻辑连接符号),在内部都会转化为物理连接(Physical Joi ...
源码：Java集合源码之：哈希表（二）
要想知道一个元素是否在数组或链表中,只能从前向后挨个对比,无论是数组还是链表,其对数据的查询表现都比较无力.在的二叉排序树中,还会将数据排序以进行二分查找,将时间复杂度从O(n)降低到O(lg n). ...
理解Golang哈希表Map的元素
目录概述哈希函数冲突解决初始化结构体字面量运行时操作访问写入扩容删除总结在上一节中我们介绍了数组和切片的实现原理,这一节会介绍 Golang 中的另一个集合元素 - 哈希 ...
6.MySQL优化---高级进阶之表的设计及优化
转自互联网整理. 优化之路高级进阶——表的设计及优化优化①:创建规范化表,消除数据冗余数据库范式是确保数据库结构合理,满足各种查询需要.避免数据库操作异常的数据库设计方式.满足范式要求的表,称为规 ...
STL的容器哈希表
C++ STL中,哈希表对应的容器是 unordered_map(since C++ 11).根据 C++ 11 标准的推荐,用 unordered_map 代替 hash_map. 与Map的区别 ...
mysql数据库性能优化（包括SQL,表结构,索引,缓存）
优化目标减少 IO 次数IO永远是数据库最容易瓶颈的地方,这是由数据库的职责所决定的,大部分数据库操作中超过90%的时间都是 IO 操作所占用的,减少 IO 次数是 SQL 优化中需要第一优先考虑,当 ...
MySQL 性能优化系列之一单表预处理
MySQL 性能优化系列之一单表预处理背景介绍我们经常在写多表关联的SQL时,会想到 left jion(左关联),right jion(右关联),inner jion(内关联)等. 但是,当表 ...
MySQL性能优化(五)：分表
原文:MySQL性能优化(五):分表版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/vbi ...

随机推荐

阿里云服务器Docket安装RabbitMQ 3.8.12
DocketMQ安装RabbitMQ 地址:https://hub.docker.com/ 拉取镜像 docker pull rabbitmq:3.8.12-management-alpine 运行 ...
解决方案 | 使用python中的os模块准确获取不带后缀的文件名和扩展名
1. 问题如何使用python获取不带后缀的文件名? 2. 解决方法如下图 import os file_name = "examp.le.pdf" file_name1_wi ...
VS Code 开发统一代码格式化配置
eslint: 是用来做代码风格检查的,比较关注代码质量,并且会提示不符合风格规范的代码,也有一部分代码格式化的功能.不是消除空行. "editor.formatOnSave": ...
FFmpeg开发笔记（四十）Nginx集成rtmp模块实现RTMP推拉流
<FFmpeg开发实战:从零基础到短视频上线>一书的"10.2.2 FFmpeg向网络推流"介绍了轻量级流媒体服务器MediaMTX,虽然MediaMTX使用很简单, ...
scratch源码下载 | 蜘蛛传说
程序说明: <蜘蛛传说>是一个通过Scratch平台制作的互动游戏项目.在这个故事中,玩家将扮演一只蜘蛛,其原本和平的生活被一只入侵的壁虎所打破.为了保卫自己的家园,蜘蛛必须运用智慧和勇气 ...
Jmeter函数助手5-RandomFromMultipleVars
RandomFromMultipleVars函数用于获取指定变量的随机变量值. Source Variable(s) (use | as separator):传入指定的变量名称,这里的变量可以是单值 ...
【Java-GUI】03 事件监听
--1.监听机制案例简答理解:操作驱动程序执行完整的操作体系:事件源.事件.监听器.注册监听案例: 点击OK按钮,让上方的输入框写入一段字符 package cn.dzz; import jav ...
【JDBC】Extra01 Oracle-JDBC
关于驱动包依赖: 官网提供的地址: https://www.oracle.com/database/technologies/jdbc-drivers-12c-downloads.html Maven ...
【转载】ubuntu用户/linux用户登录后没有自动加载.bashrc
版权声明:本文为CSDN博主「安安爸Chris」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明. 原文链接:https://blog.csdn.net/mimiduc ...
大语言模型（LLM）运行报错：AttributeError: module 'streamlit' has no attribute 'cache_resource'
解决方法: https://blog.csdn.net/javastart/article/details/130785100 (图:https://blog.csdn.net/javastart/a ...

C++ 性能反向优化——用哈希表unordered_map消除if else导致性能降低。

C++ 性能反向优化——用哈希表unordered_map消除if else导致性能降低。的更多相关文章

随机推荐

热门专题