汇编指令与Intrinsics指令的对应关系汇总

参考网址:https://software.intel.com/sites/landingpage/IntrinsicsGuide/

1、赋值指令:movq

使用方法:movq xmm, m64

功能:把源存储器低64位内容送入目的寄存器的低64位,高64位清零

对应的Intrinsics

__m128i _mm_loadl_epi64 (__m128i const* mem_addr)

介绍

__m128i _mm_loadl_epi64 (__m128i const* mem_addr)

#include "emmintrin.h"  //SSE2

Instruction: movq xmm, m64

CPUID Flags: SSE2

功能

Load 64-bit integer from memory into the first element of dst.

方法

dst[63:0] := MEM[mem_addr+63:mem_addr]
dst[MAX:64] := 0

2、加法指令:paddw

使用方法:paddw xmm, xmm

功能:源存储器与目的寄存器按字对齐无符号普通相加,内存变量必须对齐内存16字节

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_add_epi16 (__m128i a, __m128i b)

介绍

__m128i _mm_add_epi16 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: paddw xmm, xmm

CPUID Flags: SSE2

功能

Add packed 16-bit integers in a and b, and store the results in dst.

方法

<pre name="code" class="html">FOR j := 0 to 7
	i := j*16
	dst[i+15:i] := a[i+15:i] + b[i+15:i]
ENDFOR

3、减法指令:psubw

使用方法:psubw xmm, xmm

功能:源存储器与目的寄存器按字对齐无符号普通相减(目的减去源),内存变量必须对齐内存16字节

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_sub_epi16 (__m128i a, __m128i b)

介绍

__m128i _mm_sub_epi16 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: psubw xmm, xmm

CPUID Flags: SSE2

功能

Subtract packed 16-bit integers in b from packed 16-bit integers in a, and store the results in dst.

方法

<pre name="code" class="html">FOR j := 0 to 7
	i := j*16
	dst[i+15:i] := a[i+15:i] - b[i+15:i]
ENDFOR

4、低64位按字交错排列指令:punpcklwd

使用方法:punpcklwd xmm, xmm

功能:源存储器与目的寄存器低64位按字交错排列,内存变量必须对齐内存16字节

高64位 | 低64位

目的寄存器:        a7 a6 a5 a4 a3 a2 a1 a0

源寄存器:            b7 b6 b5 b4 b3 b2 b1 b0

目的寄存器结果:b3 a3 b2 a2 b1 a1 b0 a0

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_unpacklo_epi16 (__m128i a, __m128i b)

介绍

__m128i _mm_unpacklo_epi16 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: punpcklwd xmm, xmm

CPUID Flags: SSE2

功能

Unpack and interleave 16-bit integers from the low half of a and b, and store the results in dst.

方法

<pre name="code" class="html">INTERLEAVE_WORDS(src1[127:0], src2[127:0]){
	dst[15:0] := src1[15:0]
	dst[31:16] := src2[15:0]
	dst[47:32] := src1[31:16]
	dst[63:48] := src2[31:16]
	dst[79:64] := src1[47:32]
	dst[95:80] := src2[47:32]
	dst[111:96] := src1[63:48]
	dst[127:112] := src2[63:48]
	RETURN dst[127:0]
}	

dst[127:0] := INTERLEAVE_WORDS(a[127:0], b[127:0])

5、高64位按字交错排列指令:punpckhwd

使用方法:punpckhwd xmm, xmm

功能:源存储器与目的寄存器高64位按字交错排列,内存变量必须对齐内存16字节

高64位 | 低64位

目的寄存器:        a7 a6 a5 a4 a3 a2 a1 a0

源寄存器:            b7 b6 b5 b4 b3 b2 b1 b0

目的寄存器结果:b7 a7 b6 a6 b5 a5 b4 a4

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_unpackhi_epi16 (__m128i a, __m128i b)

介绍

__m128i _mm_unpackhi_epi16 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: punpckhwd xmm, xmm

CPUID Flags: SSE2

功能

Unpack and interleave 16-bit integers from the high half of a and b, and store the results in dst.

方法

<pre name="code" class="html">INTERLEAVE_HIGH_WORDS(src1[127:0], src2[127:0]){
	dst[15:0] := src1[79:64]
	dst[31:16] := src2[79:64]
	dst[47:32] := src1[95:80]
	dst[63:48] := src2[95:80]
	dst[79:64] := src1[111:96]
	dst[95:80] := src2[111:96]
	dst[111:96] := src1[127:112]
	dst[127:112] := src2[127:112]
	RETURN dst[127:0]
}

dst[127:0] := INTERLEAVE_HIGH_WORDS(a[127:0], b[127:0])

6、低64位按双字交错排列指令:punpckldq

使用方法:punpckldq xmm, xmm

功能:源存储器与目的寄存器低64位按双字交错排列,内存变量必须对齐内存16字节

高64位 | 低64位

目的寄存器:        a3 a2 a1 a0

源寄存器:            b3 b2 b1 b0

目的寄存器结果:b1 a1 b0 a0

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_unpacklo_epi32 (__m128i a, __m128i b)

介绍

__m128i _mm_unpacklo_epi32 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: punpckldq xmm, xmm

CPUID Flags: SSE2

功能

Unpack and interleave 32-bit integers from the low half of a and b, and store the results in dst.

方法

<pre name="code" class="html">INTERLEAVE_DWORDS(src1[127:0], src2[127:0]){
	dst[31:0] := src1[31:0]
	dst[63:32] := src2[31:0]
	dst[95:64] := src1[63:32]
	dst[127:96] := src2[63:32]
	RETURN dst[127:0]
}	

dst[127:0] := INTERLEAVE_DWORDS(a[127:0], b[127:0])

7、高64位按双字交错排列指令:punpckhdq

使用方法:punpckhdq xmm, xmm

功能:源存储器与目的寄存器高64位按双字交错排列,内存变量必须对齐内存16字节

高64位 | 低64位

目的寄存器:        a3 a2 a1 a0

源寄存器:            b3 b2 b1 b0

目的寄存器结果:b3 a3 b2 a2

对应的Intrinsics

<pre name="code" class="html">__m128i _mm_unpackhi_epi32 (__m128i a, __m128i b)

介绍

__m128i _mm_unpackhi_epi32 (__m128i a, __m128i b)

#include "emmintrin.h"

Instruction: punpckhdq xmm, xmm

CPUID Flags: SSE2

功能

Unpack and interleave 32-bit integers from the high half of a and b, and store the results in dst.

方法

<pre name="code" class="html">INTERLEAVE_HIGH_DWORDS(src1[127:0], src2[127:0]){
	dst[31:0] := src1[95:64]
	dst[63:32] := src2[95:64]
	dst[95:64] := src1[127:96]
	dst[127:96] := src2[127:96]
	RETURN dst[127:0]
}	

dst[127:0] := INTERLEAVE_HIGH_DWORDS(a[127:0], b[127:0])
												

汇编指令与Intrinsics指令的对应关系汇总的更多相关文章

  1. 五、案例-指令参考-freemarker指令、表达式

    案例-指令参考描述:本人自己测试写了一遍,如有错的地方,懂freemarker的朋友望指点指点! 案例-指令参考 表达式 一. Assign 1.<#assign name1="北京& ...

  2. emms指令在MMX指令中的作用

    emms指令在MMX指令中的作用 转自:http://blog.csdn.net/psusong/archive/2009/01/08/3737047.aspx MMX和SSE都是INTEL开发的基于 ...

  3. ARM指令协处理器处理指令

    ARM支持16个协处理器,在程序执行过程中,每个协处理器忽略属于ARM处理器和其他协处理器指令,当一个协处理器硬件不能执行属于她的协处理器指令时,就会产生一个未定义的异常中断,在异常中断处理程序中,可 ...

  4. ARM指令和Thumb指令区别

    Thumb指令集 ]的问题而提出的,它具有16为的代码密度.Thumb不是一个完整的体系结构,不能指望处理程序只执行Thumb指令而不支持ARM指令集.因此,Thumb指令只需要支持通用功能,必要时, ...

  5. int指令(软件中断指令)

    INT(软件中断指令)是CALL指令的一种特殊形式.call指令调用调用的子程序是用户程序的一部分,而INT指令调用的操作系统提供的子程序或者其他特殊的子程序. 中断服务子程序和标准过程的最大区别是 ...

  6. AngularJS -- 指令(创建自定义指令)

    点击查看AngularJS系列目录 转载请注明出处:http://www.cnblogs.com/leosx/   什么是指令 注:本指南是针对已经熟悉AngularJS基础知识的开发人员.如果你才刚 ...

  7. JSP中的编译指令和动作指令的区别

    JSP中的编译指令和动作指令的区别 1.编译指令是通知Servlet引擎的处理消息,而动作指令只是运行时的脚本动作 2.编译指令是在将JSP编译成Servlet时起作用,而动作指令可替换成JSP脚本, ...

  8. Javaweb学习笔记——(十二)——————JSP指令:page指令、include指令、taglib指令,JavaBean,内省,EL表达式

    JSP指令JSP指令分类 JSP有三大指令: *page指令 *include指令 *taglib指令 在JSP中没有任何指令是必须的. 但基本上每个JSP都是使用page指令============ ...

  9. vue 基础-->进阶 教程(2): 指令、自定义指令、组件

    第二章 建议学习时间4小时  课程共3章 前面的nodejs教程并没有停止更新,因为node项目需要用vue来实现界面部分,所以先插入一个vue教程,以免不会的同学不能很好的完成项目. 本教程,将从零 ...

随机推荐

  1. sql中between and 用法

    SQL中 between and是包括边界值的,not between不包括边界值,不过如果使用between and 限定日期需要注意,如果and后的日期是到天的,那么默认为00:00:00 例如: ...

  2. 查询excel中共多少个工作表,绝对好使

    用宏表函数:具体做法如下: CTLT+F3,定义一个名称,名字随便起,比如AA,公式=GET.WORKBOOK(4),确认. 然后随便一个单元格输入=AA就可以了显示有几个工作表了.

  3. selenium 方法导图

  4. flex组合流动布局实例---利用css的order属性改变盒子排列顺序

    flex弹性盒子 <div class="container"> <div class="box yellow"></div> ...

  5. 求其中同一个主叫号码的两次通话之间间隔大于10秒的通话记录ID

    求其中同一个主叫号码的两次通话之间间隔大于10秒的通话记录ID 例如:6,7,8,9,10条记录均符合 ID 主叫号码 被叫号码      通话起始时间            通话结束时间       ...

  6. JS中:数组和二维数组、MAP、Set和枚举的使用

    1.数组和二维数组:   方法一: var names = ['Michael', 'Bob', 'Tracy']; names[0];// 'Michael' 方法二: var mycars=new ...

  7. SQL-修改: 将日期修改为空NULL、修改为空的记录

    1.将日期修改为空NULL update 表 set 字段=null where 字段='' 如果设置为‘’,会默认1900-01-01 2.修改为空的记录 update [dbo].[pub_ite ...

  8. Powershell Get File/Disk Size

    知识点: 1.获取路径中的文件夹:Get-ChildItem $startFolder  | Where-Object {$_.PSIsContainer -eq $True} | Sort-Obje ...

  9. 面向对象 - 封装/property - 总结

    面向对象 - 封装: 封装:在类定义阶段,以__开头的属性名发生了变形 eg: __x --> _A__x / __foo --> _A__foo 1.特点: 1.在类外部无法直接访问 _ ...

  10. windows 键盘全局钩子

    // HookapiTest.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include <Windows.h> #inc ...