DirectDraw打造极速图形引擎(Alpha混合)

显然DirectDraw是Windows下写2D图形程序的最好选择，虽然Direct3D也可以写，但是没DirectDraw简单方便，特别对于初学者，一来就接触那么多函数和参数总不是件愉快的事，所以我的文章主要结合我做的工作，谈谈DirectDraw编程中一些比较关键的技术，大多是我自己想出来的。我想先声明，我的文章可以任意转载，源代码可以任意使用和修改。

　　由于我是业余时间写的文章，所以只能每次发表一篇，希望我的工作可以为大家的游戏增光添彩，同时我的文章主要面向有基本C++，DirectDraw，汇编和MMX编程经验的朋友，如果你对这些了解不够，请先学习一下再阅读。也欢迎大家和我交流，我的QQ是35830152，EMAIL:EUHO@SINA.COM。

　　作为第一篇，我想先谈谈Alpha混合的问题。这里32位色的图形模式我们不考虑，因为技巧并不多，占用显存和内存大，实际应用的也不多。我们把焦点放在16位色的模式上。我们把源点C2和Alpha通道点C1用Alpha混合,混合后得到点C，如果Alpha取0~1，公式如下：

C = C2*Alpha + C1*(1-Alpha)

如果Alpha取0~32，公式如下：

C = (C2*Alpha + C1*(1-Alpha))>>5

每个点由R,G,B 3个分量组成，所以上面的运算要分别对每个分量进行计算，如果整体计算，由于进位的关系我们会得到错误的结果。我们只考虑用得较多的565格式，即16位的颜色值为RRRRRGGGGGGBBBBB，555格式原理是一样的。显然我们每次处理一个点似乎只能按照“拆分-分别运算－拆分”来写代码，但是这样是低效的，想想1024*768模式下运算一帧要进行多少次运算，一定快不到哪里去。

　　Intel有段很长的代码，我没仔细看，也没试验，总觉得不太可靠（呵呵）。还看了GameRes上的一些相关文章，还是有值得参考的地方，就是觉得看了还是有些茫然。

　　下面说我的算法，首先说明这个快速算法是针对每个Alpha值建立一个函数进行运算，如果在一个函数里实现任意Alpha的运算,一次只能运算2个点，而且汇编代码是26行，而且有2次乘法，也用到了部分MMX加速。经过针对每一级Alpha的优化处理，每次处理4个点，代码只要8行左右，移位代替了乘法运算，完全发挥了MMX的威力。我只做了17级变换，0级和17级不用做，1到15原理一样，只有少少的不同，现在我举例半透明的算法，其他大家可以自己实现，有问题也可以和我交流。

　　Alpha运算中每个点3个色素，每个色素都要按上面那个公式运算，也就是每个色素要做2次乘法和一次加发，尽管可以变换一下不做浮点运算，但性能又能提高多少？我先讲一下我算法的一个基本原理，即“任意分组移位”，意思就是把一个数中分为N组，每组位数并不要求相同，我们用一次移位和一次与运算就能做到好像是每个分组移位而互不影响的效果。比半透明下Alpha=0.5，换成移位就是>>1，我们先把C右移一位，然后AND 一个2进制的数0111101111101111（0x7BEF），就完成了3个色素同时*0.5的运算，简单吧。

　　代码相信大家很容易就看懂了,大家把汇编部分和自己的程序结合就可以了,只要提供一些参数,比如页面数据指针和长度高度等资料.下次我会发布带Colorkey和Clip功能的代码,同样是MMX处理的,而且不用if(这会大大降低流水线的效率).以后还会介绍动态光源,灰度图,动画控制等高级主题,欢迎大家指导,由于水平和打字原因,可能文章中会有错误,请谅解.

下面是任意Alpha的混合运算

BOOL

CAresMaterial::DrawAlpha( LONG X, LONG Y, LPRECT pRect, BYTE Alpha )

{

    unsigned __int16 *pSrc, *pDest;

    unsigned __int32 A, PA;

    unsigned __int16 Width, Height;

    unsigned __int32 D1, D2;

    RECT Rect;

    A = Alpha & 0x1F;

    PA = 0x1F - A;

    Width = (unsigned __int16)(pRect->right - pRect->left + );

    Height = (unsigned __int16)(pRect->bottom - pRect->top + );

    D1 = (m_Desc.dwPitch - Width + )<< ;

    D2 = (m_Desc.pAres->GetScreenPitch() - Width + )<< ;

    SetRect( &Rect, X, Y, X+Width-, Y+Height- );

    m_Desc.pAres->BackToDILayer( &Rect );

    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;

    pDest = m_Desc.pAres->GetDILayerData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    __asm

    {

        mov esi,pSrc

        mov edi,pDest

        movd mm2,A

        movd mm3,PA

        mov cx,Height

        shl ecx,

        mov cx,Width

    LOOPA:

        ror ecx,

        dec cx

        jz DONE

        ror ecx,

    LOOPB:

        dec cx

        jz NEXTLINE

        //Process one point

        mov ax,[esi]

        mov dx,ax

        shl eax,

        mov ax,dx

        and eax,0x7E0F81F

        movd edx,mm2

        mul edx

        movd mm0,eax

        mov ax,[edi]

        mov dx,ax

        shl eax,

        mov ax,dx

        and eax,0x7E0F81F

        movd edx,mm3

        mul edx

        movd mm1,eax

        paddd mm0,mm1

        psrlq mm0,

        movd eax,mm0

        and eax,0x7E0F81F

        mov edx,eax

        shr edx,

        or eax,edx

        mov [edi],ax

        inc esi

        inc edi

        inc esi

        inc edi

        jmp LOOPB

    NEXTLINE:

        add esi,D1

        add edi,D2

        mov cx,Width

        jmp LOOPA

    DONE:

        emms

    }

    m_Desc.pAres->DILayerToBack( &Rect );

    return TRUE;

}

下面是半透明Alpha的混合运算

void

CAresMaterial::DrawAlpha1( LONG X, LONG Y, LPRECT pRect )

{

    unsigned __int16 *pSrc, *pDest;

    unsigned __int16 Width, Height, DW, DLeft;

    unsigned __int32 D1, D2;

    static unsigned __int64 MASKER = 0x7BEF7BEF7BEF7BEF;

    RECT Rect;

    Width = (unsigned __int16)(pRect->right - pRect->left);

    Height = (unsigned __int16)(pRect->bottom - pRect->top +  );

    pSrc = m_Desc.pData + pRect->top*m_Desc.dwPitch + pRect->left;

    pDest = m_Desc.pAres->GetBackData() + Y*m_Desc.pAres->GetScreenPitch() + X;

    DLeft = (Width % ) + ;

    DW = (Width>>) + ;

    D1 = (m_Desc.dwPitch - Width)<< ;

    D2 = (m_Desc.pAres->GetScreenPitch() - Width)<< ;

    SetRect( &Rect, X, Y, X+Width, Y+Height- );

    __asm

    {

        mov esi,pSrc

        mov edi,pDest

        mov bx,DLeft

        mov cx,Height

        shl ecx,

        mov cx,DW

    LOOPA:

        ror ecx,

        dec cx

        jz DONE

        ror ecx,

    LOOPB:

        dec cx

        jz ENDLINE

        //Process four points once

        movq mm0,[esi]

        movq mm1,[edi]

        psrlq mm0,

        psrlq mm1,

        pand mm0,MASKER

        pand mm1,MASKER

        paddw mm0,mm1

        movq [edi],mm0

        add esi,

        add edi,

        jmp LOOPB

    ENDLINE:

        dec bx

        jz NEXTLINE

        mov ax,[esi]

        mov dx,[edi]

        shr ax,

        shr dx,

        and ax,0x7BEF

        and dx,0x7BEF

        add ax,dx

        mov [edi],ax

        inc esi

        inc esi

        inc edi

        inc edi

        jmp ENDLINE

    NEXTLINE:

        add esi,D1

        add edi,D2

        mov cx,DW

        mov bx,DLeft

        jmp LOOPA

    DONE:

        emms

    }

}

DirectDraw打造极速图形引擎(Alpha混合)的更多相关文章

D3D中深度测试和Alpha混合的关系
我在学习D3D的深度测试和Alpha混合的时候,有一些遗憾.书上提供的例子里说一定要先渲染不透明物体,再渲染透明物体,对渲染状态的设置也有特殊要求.我看的很晕.自己查图形学的书,上网找资料,结果还是糊 ...
16位图像Alpha混合的实现（用汇编写的，比MMX还要快）
Alpha 混合的算法很简单,基于下面的公式就可以实现: D := A * (S - D) / 255 + D D 是目标图像的像素, S 是源图像的像素 A 是 Alpha 值, 0 为全透明, 2 ...
【转载】Alpha混合物体的深度排序
原文:Alpha混合物体的深度排序先说个题外话, 本来我想解答一下最近Creators Club论坛上经常出现的一个问题, 意外的是在网上竟然找不到什么全面的答案.. 这是个有着复杂答案的简单问题: ...
【转载】D3D深度测试和Alpha混合
原文:D3D深度测试和Alpha混合 1. 深度测试 a) 深度缓冲区:屏幕上每个像素点的深度信息的一块内存缓冲区.D3D通过比较当前绘制的像素点的深度和对应深度缓冲区的点 ...
Alpha混合
ShaderLab syntax: Blending 混合 Blending is used to make transparent objects. 混合是用来制作透明物体的. When graph ...
《逐梦旅程 WINDOWS游戏编程之从零开始》笔记8——载入三维模型&Alpha混合技术&深度测试与Z缓存
第17章三维游戏模型的载入主要是如何从3ds max中导出.X文件,以及如何从X文件加载三维模型到DirextX游戏程序里.因为复杂的3D物体,要用代码去实现,那太反人类了,所以我们需要一些建模软 ...
Shader第十三讲 Alpha混合
http://blog.sina.com.cn/s/blog_471132920101d8z5.html Alpha Blending,中文译作Alpha混合Blending就是控制透明的.处于光栅化 ...
【STM32H7教程】第56章 STM32H7的DMA2D应用之刷色块，位图和Alpha混合
完整教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=86980 第56章 STM32H7的DMA2D应用之刷色块, ...
深度排序与alpha混合
原文: https://blogs.msdn.microsoft.com/shawnhar/2009/02/18/depth-sorting-alpha-blended-objects/ 翻译:李现民 ...

随机推荐

CSS如何实现图片上下垂直居中
方法一: 使用margin方式,使图片在div中上下垂直居中.margin-top值的计算方式是:div的高度/2-图片高度/2. 代码实例如下: <!DOCTYPE html><h ...
Java同步块
原文:http://ifeve.com/synchronized-blocks/ Java 同步块(synchronized block)用来标记方法或者代码块是同步的.Java同步块用来避免竞争.本 ...
[Java] 03 String获取文件后缀名，判断文件是否合法
package test.string; import java.util.Arrays; import java.util.List; public class GetFileType { priv ...
apache下php无法解析直接显示源代码解
在http.conf中加入php的设置 #php5_start phpIniDir "d:/Program Files/php" LoadModule php5_module &q ...
ckfinder的配置使用
1.单纯的上传图片和预览图片修改configasp中CheckAuthentication = true; 否则的话会报没有权限或修改配置错误此时如果可以查看的话,单击图片应该是放大并且预览图片 ...
[HDU 4585] Shaolin (map应用)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4585 题目大意:不停的插入数字,问你跟他相距近的ID号.如果有两个距离相近的话选择小的那个. 用map ...
移植ok6410
tftp u-boot.bin http://blog.csdn.net/link_hui/article/details/5593518 LED driver http://blog.csdn.ne ...
在 ASP.NET MVC 应用中使用 NInject 注入 ASMX 类型的 Web Service
这几天,有同学问到为什么在 ASP.NET MVC 应用中,无法在 .ASMX 中使用 NInject 进行注入. 现象比如,我们定义了一个接口,然后定义了一个实现. public interfac ...
CentOS安装 Docker
系统的要求64 位操作系统,内核版本至少为 3.10. Docker 目前支持 CentOS 6.5 及以后的版本,推荐使用 CentOS 7 系统. cat /proc/version 首先,也是要 ...
利用DataTable快速批量导数据
DataSet ds = new DataSet(); using (SqlConnection conn = new SqlConnection(@"data sou ...

DirectDraw打造极速图形引擎(Alpha混合)

DirectDraw打造极速图形引擎(Alpha混合)的更多相关文章

随机推荐

热门专题