Asm Shader Reference --- Shader Model 3.0 part
ps部分
概览
| Instruction Set | |||||||||
| Name | Description | Instruction slots | Setup | Arithmetic | Texture | Flow control | New | ||
| abs - ps | 绝对值 | 1 | x | ||||||
| add - ps | 加法运算 | 1 | x | ||||||
| break - ps | 跳出一个循环 | 1 | x | ||||||
| break_comp - ps | 通过一个比较跳出循环 | 3 | x | ||||||
| breakp - ps | 基于一个断言跳出循环 | 3 | x | ||||||
| call - ps | 调用一个子程序 | 2 | x | ||||||
| callnz bool - ps | 如果一个boolean寄存器不为0的话调用一个子程序 | 3 | x | ||||||
| callnz pred - ps | 如果一个predicate寄存器不为0的话调用一个子程序 | 3 | x | ||||||
| cmp - ps | 以0为比较赋值 | 1 | x | ||||||
| crs - ps | 叉积 | 2 | x | ||||||
| dcl_samplerType (sm2, sm3 - ps asm) | 为采样器声明贴图维数 | 0 | x | ||||||
| dcl_semantics (sm3 - ps asm) | 声明输入输出寄存器 | 0 | x | x | |||||
| def - ps | 定义常量 | 0 | x | ||||||
| defb - ps | 定义一个 Boolean 常量 | 0 | x | ||||||
| defi - ps | 定义一个integer 常量 | 0 | x | ||||||
| dp2add - ps | 2D 点积之后加法运算 | 2 | x | ||||||
| dp3 - ps | 3D 点积 | 1 | x | ||||||
| dp4 - ps | 4D 点积 | 1 | x | ||||||
| dsx - ps | 改变x方向的比率 | 2 | x | ||||||
| dsy - ps | 改变y方向的比率 | 2 | x | ||||||
| else - ps | else块 | 1 | x | ||||||
| endif - ps | if结束 | 1 | x | ||||||
| endloop - ps | 结束loop | 2 | x | x | |||||
| endrep - ps | 结束repeat | 2 | x | ||||||
| exp - ps | 全精度计算2的幂 | 1 | x | ||||||
| frc - ps | 小数部分 | 1 | x | ||||||
| if bool - ps | if块 | 3 | x | ||||||
| if_comp - ps | 比较形式的if | 3 | x | ||||||
| if pred - ps | 断言形式的if | 3 | x | ||||||
| label - ps | 标签 | 0 | x | ||||||
| log - ps | 全精度计算log₂(x) | 1 | x | ||||||
| loop - ps | 循环 | 3 | x | x | |||||
| lrp - ps | 线性插值 | 2 | x | ||||||
| m3x2 - ps | 3x2 乘法 | 2 | x | ||||||
| m3x3 - ps | 3x3 乘法 | 3 | x | ||||||
| m3x4 - ps | 3x4 乘法 | 4 | x | ||||||
| m4x3 - ps | 4x3 乘法 | 3 | x | ||||||
| m4x4 - ps | 4x4 乘法 | 4 | x | ||||||
| mad - ps | 乘法之后加法运算 | 1 | x | ||||||
| max - ps | 最大值 | 1 | x | ||||||
| min - ps | 最小值 | 1 | x | ||||||
| mov - ps | 赋值 | 1 | x | ||||||
| mul - ps | 乘法 | 1 | x | ||||||
| nop - ps | 无运算 | 1 | x | ||||||
| nrm - ps | 单位化 | 3 | x | ||||||
| pow - ps | 幂运算 | 3 | x | ||||||
| ps | 版本 | 0 | x | ||||||
| rcp - ps | 倒数 | 1 | x | ||||||
| rep - ps | 循环 | 3 | x | ||||||
| ret - ps | 对主函数或子程序做return处理 | 1 | x | ||||||
| rsq - ps | 平方根的倒数 | 1 | x | ||||||
| setp_comp | 设置断言寄存器 | 1 | x | ||||||
| sincos - ps | Sin和cos | 8 | x | ||||||
| sub - ps | 减法运算 | 1 | x | ||||||
| texkill - ps | 中断像素渲染 | 2 | x | ||||||
| texld - ps_2_0 and up | 采样一个贴图 | See note 1 | x | ||||||
| texldb - ps | 根据w部分进行对贴图的level-of-detail bias采样 | 6 | x | ||||||
| texldl - ps | 根据来自w通道的level-of-detail来采样图片 | See note 2 | x | x | |||||
| texldd - ps | 用户提供一个剃度值来采样贴图 | 3 | x | ||||||
| texldp - ps | 根据w部分进行对贴图的投影划分采样 | See note 3 | x | ||||||
部分函数细节
dcl_semantics (sm3 - ps asm)
语法
dcl_semantics [_centroid] dst[.write_mask]
示例
ps_3_0
; Declaring inputs
dcl_normal v0.xyz
dcl_blendweight v0.w ; Must be same reg# as normal,matching vshader packing
dcl_texcoord1 v1.y ; Mask can be any subset of mask from vshader semantic
dcl_texcoord0 v1.zw; Has to be same reg# as texcoord1, to match vshader
; Declaring samplers
dcl_2d s0
dcl_2d s1
def c0, 0, 0, 0, 0
mov r0.x, v1.y ; texcoord1
mov r0.y, c0
texld r0, r0, s0
texld r1, v1.zw, s1
...
(output regs in ps_3_0 are same as ps_2_0: oC0-oC3,oDepth)
texldl - ps
语法
texldl dst, src0, src1
用于mipmap处理
算法
在mipmap滤波方式为linear时
LOD = src0.w + LODBIAS;
if (LOD <= 0 )
{
LOD = 0;
Filter =MagFilter;
tex = Lookup(MAX(MAXMIPLEVEL, LOD), Filter );
}
else
{
Filter =MinFilter;
LOD = MAX(MAXMIPLEVEL, LOD );
tex = Lookup(Floor(LOD), Filter );
if( MipFilter ==LINEAR )
{
tex1 =Lookup( Ceil(LOD), Filter );
tex = (1 -frac(src0.w))*tex + frac(src0.w)*tex1;
}
}
vs部分
概览
| Instruction Set | |||||||||
| Name | Description | Instruction slots | Setup | Arithmetic | Texture | Flow control | New | ||
| abs - vs | 绝对值 | 1 | x | ||||||
| add - vs | 加法运算 | 1 | x | ||||||
| break - vs | 跳出一个循环 - vs...endloop - vs 或者 rep...endrep 块 | 1 | x | ||||||
| break_comp - vs | 通过一个比较跳出循环 - vs...endloop - vs or rep...endrep block, with a comparison | 3 | x | ||||||
| breakp - vs | 跳出一个循环 - vs...endloop - vs 或 rep...endrep 块, 基于一个断言 | 3 | x | ||||||
| call - vs | 调用一个子程序 | 2 | x | ||||||
| callnz bool - vs | 如果一个boolean寄存器不为0的话调用一个子程序 | 3 | x | ||||||
| callnz pred - vs | 如果一个predicate寄存器不为0的话调用一个子程序 | 3 | x | ||||||
| crs - vs | 叉积 | 2 | x | ||||||
| dcl_usage input (sm1, sm2, sm3 - vs asm) | 为采样器声明贴图维数 | 0 | x | ||||||
| dcl_samplerType (sm3 - vs asm) | 为采样器声明贴图维数 | 0 | x | x | |||||
| def - vs | 定义常量 | 0 | x | ||||||
| defb - vs | 定义一个 Boolean 常量 | 0 | x | ||||||
| defi - vs | 定义一个integer 常量 | 0 | x | ||||||
| dp3 - vs | 3D 点积 | 1 | x | ||||||
| dp4 - vs | 4D 点积 | 1 | x | ||||||
| dst - vs | 计算距离向量 | 1 | x | ||||||
| else - vs | Begin an else block | 1 | x | ||||||
| endif - vs | 结束if - vs...else - vs block | 1 | x | ||||||
| endloop - vs | 结束循环 - vs block | 2 | x | ||||||
| endrep - vs | 结束 repeat 块 | 2 | x | ||||||
| exp - vs | 全精度计算2的幂 | 1 | x | ||||||
| exp - vs | 半精度计算2的幂 | 1 | x | ||||||
| frc - vs | 小数部分 | 1 | x | ||||||
| if bool - vs | Begin an if bool - vs block (using a Boolean condition) | 3 | x | ||||||
| if_comp - vs | Begin an if bool - vs block, with a comparison | 3 | x | ||||||
| if pred - vs | Begin an if bool - vs block with a predicate condition | 3 | x | ||||||
| label - vs | 标签 | 0 | x | ||||||
| lit - vs | 局部光照计算 | 3 | x | ||||||
| log - vs | 全精度计算log₂(x) | 1 | x | ||||||
| logp - vs | 半精度计算log₂(x) | 1 | x | ||||||
| loop - vs | 循环 | 3 | x | ||||||
| lrp - vs | 线性插值 | 2 | x | ||||||
| m3x2 - vs | 3x2 乘法 | 2 | x | ||||||
| m3x3 - vs | 3x3 乘法 | 3 | x | ||||||
| m3x4 - vs | 3x4 乘法 | 4 | x | ||||||
| m4x3 - vs | 4x3 乘法 | 3 | x | ||||||
| m4x4 - vs | 4x4 乘法 | 4 | x | ||||||
| mad - vs | 乘法之后加法运算 | 1 | x | ||||||
| max - vs | 最大值 | 1 | x | ||||||
| min - vs | 最小值 | 1 | x | ||||||
| mov - vs | 赋值 | 1 | x | ||||||
| mova - vs | 从浮点寄存器到地址寄存器(a0)移动数据 | 1 | x | ||||||
| mul - vs | 乘法 | 1 | x | ||||||
| nop - vs | 无运算 | 1 | x | ||||||
| nrm - vs | 单位化 | 3 | x | ||||||
| pow - vs | 幂运算 | 3 | x | ||||||
| rcp - vs | 倒数 | 1 | x | ||||||
| rep - vs | 循环 | 3 | x | ||||||
| ret - vs | 对主函数或子程序做return处理 | 1 | x | ||||||
| rsq - vs | 平方根的倒数 | 1 | x | ||||||
| setp_comp - vs | 设置断言寄存器 | 1 | x | ||||||
| sge - vs | 大于等于比较 | 1 | x | ||||||
| sgn - vs | 返回符号 | 3 | x | ||||||
| sincos - vs | Sin和cos | 8 | x | ||||||
| slt - vs | 小于比较 | 1 | x | ||||||
| sub - vs | 减法 | 1 | x | ||||||
| texldl - vs | 根据用户可调level-of-detail载入贴图 | See note 1 | x | x | |||||
| vs | 版本 | 0 | x | ||||||
---wolf96 2017/1/3
Asm Shader Reference --- Shader Model 3.0 part的更多相关文章
- Asm Shader Reference --- Shader Model 2.0 part
ps部分 ps_2_0 概览 Instruction Set Name Description Instruction slot ...
- Asm Shader Reference --- Shader Model 2.x part
ps部分 概览 Instruction Set Name Description Instruction slots S ...
- Asm Shader Reference --- Shader Model 1 part
ps部分 ps_1_1,ps_1_2,ps_1_3,ps_1_4 总览 Instruction Set ...
- 微软的HLSL Shader Model 6.0 compiler要转向LLVM了,开源的节奏. Apple/Khronos都有各自计划
So, Microsoft is making an opensource HLSL-to-almost-LLVM compiler, and Khronos is making an opensou ...
- Shader Model 3.0:Using Vertex Textures SM3:使用顶点纹理 (NVIDIA spec, 6800支持使用D3DFMT_R32F and D3DFMT_A32B32G32R32F的纹理格式实现Vertex Texture。)
翻译者 周波 zhoubo22@hotmail.com 版权所有 Philipp Gerasimov Randima (Randy) Fernando Simon Green NVIDIA Corpo ...
- Unity3D for VR 学习(9): Unity Shader 光照模型 (illumination model)
关于光照模型 所谓模型,一般是由学术算法发起, 经过大量实际数据验证而成的可靠公式 现在还记得2009年做TD-SCDMA移动通信算法的时候,曾经看过自由空间传播模型(Free space propa ...
- ePass1000 Full ActiveX Control Reference Manual Version 2.0
ePass1000 Full ActiveX Control Reference Manual Version 2.0 Error Code Value Return Status Descripti ...
- caffe编译时候出现 undefined reference to `TIFFReadRGBAStrip@LIBTIFF_4.0'
1.编译时候出现 make: * [.build_release/examples/siamese/convert_mnist_siamese_data.bin] Error 1 /usr/local ...
- Create a Basic Shader in Shader Forge
[Create a Basic Shader in Shader Forge] 1.打开ShaderForge.Window-> Shader Forge.(打开速度较慢) 2.通过NewSha ...
随机推荐
- memcached全面剖析--4
memcached的分布式算法 memcached的分布式 正如第1次中介绍的那样, memcached虽然称为“分布式”缓存服务器,但服务器端并没有“分布式”功能. 服务器端仅包括 第2次. 第 ...
- php 中文字符串首字母的获取函数
这篇文章介绍了php 中文字符串首字母的获取函数,有需要的朋友可以参考一下 function chineseFirst($str) { $str= iconv("UTF-8",&q ...
- Web应用工作流程总结
了解Web应用的工作过程有益于Web测试时更好的理解,Web应用工作的过程分为以下5个步骤: 1. 用户在Web浏览器中输入一个Web地址.选择一个超链接或点击一个按钮 2. Web浏览器将用户的动作 ...
- Codeforces Round #334 (Div. 1) C. Lieges of Legendre
Lieges of Legendre 题意:有n堆牛,每堆有ai头牛.两个人玩一个游戏,游戏规则为: <1>从任意一个非空的堆中移走一头牛: <2>将偶数堆2*x变成k堆,每堆 ...
- 4、Hbase
1).逻辑模型 Hbase 以表的形式存储数据,每个表由行和列组成,每个列属于一个特定的列族. 表中由行和列确定的存储单元称为一个元素,每个元素保存了同一份数据的多个版本,由时间戳来标识.行健是数据行 ...
- 深入浅出分析C#接口的作用
1.C#接口的作用 :C#接口是一个让很多初学C#者容易迷糊的东西,用起来好像很简单,定义接口,里面包含方法,但没有方法具体实现的代码,然后在继承该接口的类里面要实现接口的所有方法的代码,但没有真正认 ...
- 排队(BZOJ1731:[Usaco2005 dec]Layout 排队布局)
[问题描述] Czy喜欢将他的妹子们排成一队.假设他拥有N只妹纸,编号为1至N.Czy让他们站成一行,等待自己来派送营养餐.这些妹纸按照编号大小排列,并且由于它们都很想早点吃饭,于是就很可能出现多只妹 ...
- 图片上传并显示(兼容ie),图片大小判断
图片上传并显示(兼容ie),图片大小判断 HTML <div id="swf" style="margin: 0 auto;text-align: center;& ...
- [转载]MongoDB学习 (四):创建、读取、更新、删除(CRUD)快速入门
本文介绍数据库的4个基本操作:创建.读取.更新和删除(CRUD). 接下来的数据库操作演示,我们使用MongoDB自带简洁但功能强大的JavaScript shell,MongoDB shell是一个 ...
- FFT初步学习小结
FFT其实没什么需要特别了解的,了解下原理,(特别推荐算法导论上面的讲解),模板理解就行了.重在运用吧. 处理过程中要特别注意精度. 先上个练习的地址吧: http://vjudge.net/vjud ...