EAC3基于hebap来决定mantissa的quantizer. hebap如下:

mantissa 使用VQ(vector quantization) 和GAQ(gain adaptive quantization)进行编码。

1)VQ

对于AHT process, 每个block中的第k个spectral bin的mantissa组合在一起(共6个mantissa)形成一个6维的vector.

如果使用AHT,并且bit allocation pointer在1~7之间,就使用VQ来编码mantissa.

如果一组mantissa(共6个mantissa)使用VQ的话,在bitstream中存在一个N bit的index,用来查找一个6维的vector table,在vector table中的每个value是16 bit有符号的数。

如hebap为1时,N等于2。

在encoder端选择最优的vector,使得vector与实际的mantissa vector的Euclidean distance最小。那么在encoder端只需要transmit 最优vector的index.

在decoder端读出bitstream中的index,使用vector table中index对用的vector来作为mantissa.

2)GAQ

GAQ使用variable-length codewords来quantize mantissa.

在encoder端,在一个DCT block内的一个或多个经常出现的smaller transform coefficient mantissa条件性的进行gain amplify,并使用较短的codewords来描述这样的smaller mantissa.

larger transform coefficient mantissa则不进行gain amplify.由于larger mantissa在audio signal中不是经常出现,所以使用较长的codewords来描述。

在encoder选择gain,每6个GAQ coded DCT block,gain和mantissa codeword作为side info来transmit.

在decoder端首先unpack gain,并用gain来reconstruct 每个单独的transform coefficient mantissa.在decoder,对smaller mantissa乘以一个attenuation factor, gain factor并不作用于larger mantissa.

GAQ dequantization 如下图:

Deformatter 使用hebap来决定当前(第k个)DCT block中的6个mantissa是否使用GAQ编码。

Deformatter对gaqgain处理产生一个gain attenuation element, 每个gain attenuation element对应每个DCT mantissa block。

Bitstream中使用一个unique identifier tag来表示是否是larger mantissa.

如果某个channel使用AHT,那么在bitstream中的每个frame包含一个2 bit的参数gaqmod。

如果gaqmod = 0, GAQ没有使用,并且在bitstream中没有gain。

如果gaqmod =1、2,使用1bit来标识gain value.gain value作用于每个DCT block.

如果gaqmod =3, 使用5bit来group 3个gain value.grpgain表示5 bit group value, M1,M2,M3表示gain的map value.

M1 = truncate (grpgain / 9)
M2 = truncate ((grpgain % 9) / 3)
M3 = (grpgain % 9) % 3

如果gain为1,或者没有gain value,那么没有标识large mantissa的tag,只是一个quantizer.

如果gain为2 or 4,那么decoder根据Table E3.5解码large 和small mantissa.large & small mantissa是2进制补码表示的有符号浮点型数据。

m表示mantissa 的bit数,从hebap中得到。

由于large mantissa使用dead-zone quantizer, 需要将large mantissa codeword remap成mantissa.

remap的公式为:y = x + ax + b(x表示mantissa codeword)

EAC3 mantissa quantization(VQ & GAQ)的更多相关文章

  1. AC3 mantissa quantization and decoding

    1.overview 所有的mantissa被quantize到固定精确度的level(有相应的bap标识)上,level小于等于15时,使用symmetric quantization.level大 ...

  2. machine learning学习笔记

    看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/clas ...

  3. Approximate Nearest Neighbors.接近最近邻搜索

    (一):次优最近邻:http://en.wikipedia.org/wiki/Nearest_neighbor_search 有少量修改:如有疑问,请看链接原文.....1.Survey:Neares ...

  4. RGB-D action recognition using linear coding

    First, a depth spatial-temporal descriptor is developed to extract the interested local regions in d ...

  5. Text Prompted Remote Speaker Authentication : Joint Speech and Speaker Recognition/Verification System :: Major Project ::: Introduction

    转载自:http://ganeshtiwaridotcomdotnp.blogspot.com/2010/12/text-prompted-remote-speaker.html Biometrics ...

  6. Speech Recognition Java Code - HMM VQ MFCC ( Hidden markov model, Vector Quantization and Mel Filter Cepstral Coefficient)

    Hi everyone,I have shared speech recognition code inhttps://github.com/gtiwari333/speech-recognition ...

  7. 语音信号处理之(三)矢量量化(Vector Quantization)

    语音信号处理之(三)矢量量化(Vector Quantization) zouxy09@qq.com http://blog.csdn.net/zouxy09 这学期有<语音信号处理>这门 ...

  8. 矢量量化(VQ)

    作者:桂. 时间:2017-05-31  21:14:56 链接:http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ(Vector Quant ...

  9. 漫谈 Clustering (番外篇): Vector Quantization

    在接下去说其他的聚类算法之前,让我们先插进来说一说一个有点跑题的东西:Vector Quantization.这项技术广泛地用在信号处理以及数据压缩等领域.事实上,在 JPEG 和 MPEG-4 等多 ...

随机推荐

  1. leetcode四道组合总和问题总结(39+40+216+377)

    39题目: 链接:https://leetcode-cn.com/problems/combination-sum/ 给定一个无重复元素的数组 candidates 和一个目标数 target ,找出 ...

  2. Secondary NameNode:它究竟有什么作用?

    前言 最近刚接触Hadoop, 一直没有弄明白NameNode和Secondary NameNode的区别和关系.很多人都认为,Secondary NameNode是NameNode的备份,是为了防止 ...

  3. 03-SV过程语句和子程序

    1.过程语句 for语句.do-while语句.while语句 initial begin string cmd; int file,c; $display("=========== con ...

  4. PTA 1002 A+B for Polynomials

    问题描述: This time, you are supposed to find A+B where A and B are two polynomials. Input Specification ...

  5. 双 leave 栈迁移的坑

    目录 简介 问题 解决办法 简介   之前在复现自己做出来的题时,一样的思路发现拿不了 shell 了,后来发现是栈迁移的坑. 问题   假设 32 位系统中,漏洞函数可以任意写入 0x0000000 ...

  6. equals 为什么要把常量写在前面?

    看例子 使用str1.equals("abc"); 如果str1是null,空是没有equals方法的,会抛出空指针异常 如果"abc".equals(str1 ...

  7. LeetCode 3sum-closest 题解

    思路 排序 枚举一个数a 双指针移动法确定b和c 求和,更新最接近的值 复杂度 T(n)=O(n2)&ThickSpace;M(n)=O(1)T(n)=O(n^2) \; M(n)=O(1)T ...

  8. MySQL进阶之索引

    一.索引的本质: 数据库查询是数据库的最主要的功能之一,数据库系统的设计者从查询算法的角度对数据库进行了一定的优化. 最基本的顺序查找算法的复杂度为O(n),在数据量很大的时候算法的效率是很低的.虽然 ...

  9. 一些PC小软件/工具/神器备份

    小巧.有用的工具,提升工作效率. 以下所有软件均在吾爱破解可以找到(善用搜索) everything(本机文件搜索神器) 天若OCR文字识别(强无敌) QQ拼音截屏工具(从QQ拼音/QQ中独立拿出来的 ...

  10. Java如何自定义注解

    本文主要是记录所学,以供后续参考.注解是Java 1.5引入的,Java自定义注解是通过运行时靠反射获取注解,注解相当于是一种嵌入在程序中的元数据,可以使用注解解析工具或编译器对其进行解析,也可以指定 ...