一种基于DeltaE(CIE 1976)的找色算法Cuda实现

书接上文一种基于DeltaE(CIE 1976)的找色算法

Delta E 是评估色彩准确度的重要测量指标。摄影师、影片编辑和平面设计师等创意专业人士都应重视这项标准，因其是选择专业级显示器的重要考虑因素。

常见的找色算法都是基于颜色RGB上的数值差，这种方法虽然快捷，但是和人眼视觉上的色彩并不相同。这里采用Delta E的评估标准找色更符合人眼的直观感觉。

上文使用CPU计算，采用了一些优化方法但是都不尽如人意，这里使用cuda加速提高这个算法的可用度。

//计算颜色之间的Delta E

//<= 1.0：人眼无法感知差异

//1 - 2：仔细观察可以感知差异

//2 - 10：随意一看便可以感知差异

//11 - 49：色彩的相似程度大于相反程度

//100：色彩完全失真

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include <stdio.h>

#include <cmath>

#include <ctime>

cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size);

struct Color_BGR

{

    int B, G, R;

};

struct Color_Lab

{

    float L, a, b;

};

Color_Lab BGR2Lab(Color_BGR x)

{

#define gamma(x) (((x) > 0.04045) ? std::pow(((x)+0.055f) / 1.055f, 2.4f) : ((x) / 12.92));

    const float param_13 = 1.0f / 3.0f;

    const float param_16116 = 16.0f / 116.0f;

    const float Xn = 0.950456f;

    const float Yn = 1.0f;

    const float Zn = 1.088754f;

    float RR = gamma(x.R / 255.0);

    float GG = gamma(x.G / 255.0);

    float BB = gamma(x.B / 255.0);

    float X, Y, Z, fX, fY, fZ;

    X = 0.4124564f * RR + 0.3575761f * GG + 0.1804375f * BB;

    Y = 0.2126729f * RR + 0.7151522f * GG + 0.0721750f * BB;

    Z = 0.0193339f * RR + 0.1191920f * GG + 0.9503041f * BB;

    X /= (Xn);

    Y /= (Yn);

    Z /= (Zn);

    if (Y > 0.008856f)

        fY = std::pow(Y, param_13);

    else

        fY = 7.787f * Y + param_16116;

    if (X > 0.008856f)

        fX = std::pow(X, param_13);

    else

        fX = 7.787f * X + param_16116;

    if (Z > 0.008856)

        fZ = std::pow(Z, param_13);

    else

        fZ = 7.787f * Z + param_16116;

    float L, a, b;

    L = 116.0f * fY - 16.0f;

    L = L > 0.0f ? L : 0.0f;

    a = 500.0f * (fX - fY);

    b = 200.0f * (fY - fZ);

    return { L,a,b };

}

cudaError_t FindColorCuda(Color_BGR *src, float *ret,Color_Lab target,unsigned int size);

__global__ void FindColorCudaKernel(Color_BGR *src, float* ret, Color_Lab target)

{

    int i = blockIdx.x * 256 + threadIdx.x;

#define gamma(x) (((x) > 0.04045) ? pow(((x)+0.055f) / 1.055f, 2.4f) : ((x) / 12.92));

    const float param_13 = 1.0f / 3.0f;

    const float param_16116 = 16.0f / 116.0f;

    const float Xn = 0.950456f;

    const float Yn = 1.0f;

    const float Zn = 1.088754f;

    float RR = gamma(src[i].R / 255.0);

    float GG = gamma(src[i].G / 255.0);

    float BB = gamma(src[i].B / 255.0);

    float X, Y, Z, fX, fY, fZ;

    X = 0.4124564f * RR + 0.3575761f * GG + 0.1804375f * BB;

    Y = 0.2126729f * RR + 0.7151522f * GG + 0.0721750f * BB;

    Z = 0.0193339f * RR + 0.1191920f * GG + 0.9503041f * BB;

    X /= (Xn);

    Y /= (Yn);

    Z /= (Zn);

    if (Y > 0.008856f)

        fY = pow(Y, param_13);

    else

        fY = 7.787f * Y + param_16116;

    if (X > 0.008856f)

        fX = pow(X, param_13);

    else

        fX = 7.787f * X + param_16116;

    if (Z > 0.008856)

        fZ = pow(Z, param_13);

    else

        fZ = 7.787f * Z + param_16116;

    float L, a, b;

    L = 116.0f * fY - 16.0f;

    L = L > 0.0f ? L : 0.0f;

    a = 500.0f * (fX - fY);

    b = 200.0f * (fY - fZ);

    ret[i] = sqrt((L - target.L) * (L - target.L) + (a - target.a) * (a - target.a) + (b - target.b) * (b - target.b));

}

Color_BGR src_mat[1024 * 1024];

float ret_mat[1024 * 1024];

int main()

{

    for (int i = 0; i < 1024 * 1024; i++)

    {

        src_mat[i] = { std::rand() % 256,std::rand() % 256, std::rand() % 256 };

    }

    //Pre Run for Best Speed

    cudaError_t cudaStatus = FindColorCuda(src_mat, ret_mat, BGR2Lab({ 190,35,41 }), 1024 * 1024);

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "FindColorCuda failed!");

        return 1;

    }

    int st = clock();

    // Add vectors in parallel.

    cudaStatus = FindColorCuda(src_mat, ret_mat, BGR2Lab({190,35,41}), 1024 * 1024);

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "FindColorCuda failed!");

        return 1;

    }

    printf("Cost: %d\n", clock() - st);

    int count = 0;

    for (int i = 0; i < 1024*1024 ; i++)

    {

        if (ret_mat[i] < 2)

            count++;

    }

    printf("%d", count);

    // cudaDeviceReset must be called before exiting in order for profiling and

    // tracing tools such as Nsight and Visual Profiler to show complete traces.

    cudaStatus = cudaDeviceReset();

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaDeviceReset failed!");

        return 1;

    }

    return 0;

}

//Helper

cudaError_t FindColorCuda(Color_BGR* src, float* ret, Color_Lab target, unsigned int size)

{

    Color_BGR* dev_src = nullptr;

    float* dev_ret = nullptr;

    cudaError cudaStatus;

    // Choose which GPU to run on, change this on a multi-GPU system.

    cudaStatus = cudaSetDevice(0);

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaSetDevice failed!  Do you have a CUDA-capable GPU installed?");

        goto Error;

    }

    // Allocate GPU buffers for three vectors (two input, one output)    .

    cudaStatus = cudaMalloc((void**)&dev_src, size * sizeof(Color_BGR));

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaMalloc failed!");

        goto Error;

    }

    cudaStatus = cudaMalloc((void**)&dev_ret, size * sizeof(float));

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaMalloc failed!");

        goto Error;

    }

    // Copy input vectors from host memory to GPU buffers.

    cudaStatus = cudaMemcpy(dev_src, src, size * sizeof(Color_BGR), cudaMemcpyHostToDevice);

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaMemcpy failed!");

        goto Error;

    }

    FindColorCudaKernel <<<size/256, 256 >>> (dev_src,dev_ret,target);

    // Check for any errors launching the kernel

    cudaStatus = cudaGetLastError();

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "FindColorCuda launch failed: %s\n", cudaGetErrorString(cudaStatus));

        goto Error;

    }

    // cudaDeviceSynchronize waits for the kernel to finish, and returns

    // any errors encountered during the launch.

    cudaStatus = cudaDeviceSynchronize();

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaDeviceSynchronize returned error code %d after launching addKernel!\n", cudaStatus);

        goto Error;

    }

    cudaStatus = cudaMemcpy( ret, dev_ret, size * sizeof(float), cudaMemcpyDeviceToHost);

    if (cudaStatus != cudaSuccess) {

        fprintf(stderr, "cudaMemcpy failed!");

        goto Error;

    }

Error:

    cudaFree(dev_ret);

    cudaFree(dev_src);

    return cudaStatus;

}

在4060 LapTop 上取得 8ms（1024*1024）的成绩

一种基于DeltaE(CIE 1976)的找色算法Cuda实现的更多相关文章

五种基于RGB色彩空间统计的皮肤检测算法
最近一直在研究多脸谱识别以及如何分辨多个皮肤区域是否是人脸的问题网上找了很多资料,看了很多篇文章,将其中基于RGB色彩空间识别皮肤的统计算法做了一下总结,统计识别方法主要是简单相比与很多其它基于 ...
一种基于LQR使输出更加稳定的算法（超级实用）
已知: 令: 则: 以上三式成立具体步骤: 状态量最后一行加入“上一时刻的控制量”: A,B根据上述方法变形: Q,R增加维度(控制量一般都为一个,此时R维度不变): 最关键的是——输出量已经变为“ ...
（转载）找圆算法（(HoughCircles)总结与优化
Opencv内部提供了一个基于Hough变换理论的找圆算法,HoughCircle与一般的拟合圆算法比起来,各有优势:优势:HoughCircle对噪声点不怎么敏感,并且可以在同一个图中找出多个圆 ...
转载-找圆算法（(HoughCircles)总结与优化-霍夫变换
原文链接: http://www.opencv.org.cn/forum.php?mod=viewthread&tid=34096 找圆算法((HoughCircles)总结与优化 Ope ...
找圆算法（(HoughCircles)总结与优化
http://www.opencv.org.cn/forum.php?mod=viewthread&tid=34096 Opencv内部提供了一个基于Hough变换理论的找圆算法,Hough ...
[信安Presentation]一种基于GPU并行计算的MD5密码解密方法
-------------------paper--------------------- 一种基于GPU并行计算的MD5密码解密方法 0.abstract1.md5算法概述2.md5安全性分析3.基 ...
一种基于 Numpy 的 TF-IDF 实现报告
一种基于 Numpy 的 TF-IDF 实现报告摘要本文使用了一种 state-of-the-art 的矩阵表示方法来计算每个词在每篇文章上的 TF-IDF 权重(特征).本文还将介绍基于 TF- ...
26种基于PHP的开源博客系统
26种基于PHP的开源博客系统来源:本站原创 PHP学习笔记以下列举的PHP开源Blog系统中,除了我们熟知的WordPress之外,大多都没有使用过,其中一些已经被淘汰,或者有人还在使用.除了做 ...
Hive数据分析——Spark是一种基于rdd（弹性数据集）的内存分布式并行处理框架，比于Hadoop将大量的中间结果写入HDFS，Spark避免了中间结果的持久化
转自:http://blog.csdn.net/wh_springer/article/details/51842496 近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上 ...
LM-MLC 一种基于完型填空的多标签分类算法
LM-MLC 一种基于完型填空的多标签分类算法 1 前言本文主要介绍本人在全球人工智能技术创新大赛[赛道一]设计的一种基于完型填空(模板)的多标签分类算法:LM-MLC,该算法拟合能力很强能感知标签 ...

随机推荐

.NET Core 引发的异常:“sqlsugar.sqlsugarexception” 位于 system.private.corelib.dll 中
运行一个.NET Core 项目报错:引发的异常:"sqlsugar.sqlsugarexception" 位于 system.private.corelib.dll 中 . 我 ...
【LeetCode二叉树#18】修剪二叉搜索树（涉及重构二叉树与递归回溯）
修剪二叉搜索树力扣题目链接(opens new window) 给定一个二叉搜索树,同时给定最小边界L 和最大边界 R.通过修剪二叉搜索树,使得所有节点的值在[L, R]中 (R>=L) .你 ...
React时间转换为具体的年月日上午下午
export default class index extends Component { constructor() { super(); this.state = { date: new Dat ...
【Azure 应用服务】应用代码中需要使用客户端证书访问服务接口，部署在应用服务后报错不能找到证书（Cannot find the X.509 certificate)
问题描述在应用中,需要访问另一个服务接口,这个接口需要使用客户端证书进行认证.在代码中使用 System.Security.Cryptography.X509Certificates 加载Windo ...
HttpRunner使用教程？
什么是HttpRunner? 它是一种面向http协议的测试框架,它只需要去维护一份yaml/json文件就可以使用自动化测试,结合locus性能测试,线上性能监控,持续集成等多种需求工作原理: 通 ...
C#与C互操作
C#给C++传递char**(转载) extern "C" _declspec(dllexport)void GetResult(char* a,char** pBuf) { sp ...
MVC阶段所有框架完整组合示例
思路:创建工程,导包.编辑配置文件包括核心spring配置 SpringConfig myBatis 配置文件 mybatisConfig JdbcConfig jdbc.properti ...
pod探针的三种类型及三种检测方式
Pod探针是Kubernetes中的一种机制,用于检测Pod中的容器是否正常运行.它主要有三种类型:存活探针(LivenessProbe).就绪探针(ReadinessProbe)和启动探针(Star ...
Android自定义View学习（1）——基础知识介绍
原文:Android自定义View学习(1)--基础知识介绍 - Stars-One的杂货小窝准备学习自定义View,介绍一下先了解了下相关的前置基础知识,特此总结本系列集合文章链接可访问Andr ...
linux shell 字体颜色设置
使用 echo -e "\033[0;32;40m" 可以将字体设置成绿色. 这里必须使用echo 的选项 "-e",因为后面需要用到转义序列. 转义序列就是一 ...

一种基于DeltaE(CIE 1976)的找色算法Cuda实现

一种基于DeltaE(CIE 1976)的找色算法Cuda实现的更多相关文章

随机推荐

热门专题