当前位置:首页 » 文件管理 » 压缩机FFT

压缩机FFT

发布时间: 2022-09-06 19:14:19

㈠ 音频压缩原理

音频压缩的原理
转自http://forums.dearhoney.idv.tw/viewtopic.php?t=24378

引用:
音讯资料因为其资料内容的特性,以传统的压缩法难达到很高的压缩率,不过我们人耳并没有无限的时间分辨率和频率分辨率,其实原始的音乐讯号中包含了很多我们听不到的资料,把这些对我们来讲其实无意义的资讯给去掉,这样就可以达到很高的压缩率。这种利用人类 感官知觉的特性作的失真压缩法,就叫做 perceptual coding。
人耳的生理结构,由外耳的耳壳收集外界的声波到达中耳的耳膜产生震动,经由三块小骨连接前庭窗传入内耳,其中由于耳壳的内凹形状,外耳道的长度和宽度.. 等等生理的构造,会对不同频率产生共振升压的效果,尤其是 2~5Khz 的频率,会在这个过程中被放大。人耳听觉频率的范围,大约是 20~20KHz,音量范围则是 130dB SPL,大于 130dB 会产生痛苦的感觉,小于 0dB 则会被当成是静音。如上所述,人耳对 2~5KHz 的频率最敏感,越往高频感觉越不敏锐,音量要超过一定的界限以上查能被我们人耳察觉,这个最低可以听闻的界限,叫做 ATH(absolute threshold of hearing)。内耳的耳蜗有许多绒毛细胞,分别会对不同的频率产生反应,将基底膜淋巴液的波动转换成神经的电流讯号,传达给大脑。也就是说耳蜗的作用就像一个频谱分析仪,把声波转换成不同频率的讯号,每一个特定位置的绒毛细胞会受特定频率的刺激,但是当基底膜传导波动时其邻近周围的绒毛细胞也会受到刺激。这也就是说如果有一个频率的音量很大,在它附近同时有一个比较弱的频率的话,比较弱的频率的声音就会被比较强的声音给遮蔽掉,我们人耳没有办法分办出有另一个比较弱的频率的声音存在。这个遮蔽的作用叫 frquency masking。另外从基底膜受到声音震动到达稳定状态,还有声音结束后完全停止,中间都需要一段时间。所以如果有一个很大声的声音出现,在这个声音开始之前,到这个声音结束之后,有一段时间我们是听不到其他声音的,这种遮蔽效应,我们称为 temporal masking,之前的叫 pre-masking,之后的叫 post-masking。
前面提到耳蜗就像一部频谱分析仪,或者说像一个 band pass filter,会把声音分成许多不同的次频带,每个频带里都有一个中心频率,越往两边遮蔽的效果就越弱,在同一个频带里面的频率会互相影响,我们对他们的感知特性也十分的接近,这种人耳知觉特性的频带,我们称为 critical band。critical band 的宽度并不是都相等的,低频的部分比较窄,高频的部分则比较宽,总共分成 26 个 critical band。
除了人耳的生理结构特性以外,大脑的作用也占了一个很重要的角色。我们都知道音高是由基音决定,而音色是由泛音决定,我们很惊讶的发现,人类的大脑会自动补上基音,即使这个基音并不存在。譬如说电话的频宽只有 300~3200Hz,但是当我们听一个基音在 120Hz 的男性讲电话的时候,我们还是可以听出他的正确的音高,不会把男生听成女生。大脑是如何运用复杂的计算去重建这个不存在的基音,我们目前尚无法得知。

经过长期的实验和观察,我们可将人耳的听觉特性定性,建立一个人耳的听觉模型,叫做 psychoacoustic model。有了这些对人耳知觉特性的了解,我们就可以根据这些理论来压缩音讯资料,把我们听不到的声音去掉。
说是去掉,实际上是怎么做的呢?
要将无限的连续的类比讯号转变为有限的离散的数位资料,中间必须经过取样和量化的手续。譬如说现在量化的位阶只有 0~8 九个数字,每一个位阶的间隔大小是一格,对一个 4.9 的讯号作量化,得到的数字是 5,和原来 4.9 相差 0.1,这个误差叫做量化噪音。假设我们把量化的位阶减少到 5 个,分别等于原来 0~8 的 0, 2, 4, 6, 8 这几个数字,位阶的间隔大小扩大变成二格,此时再对 4.9 量化,量化的结果是 4,误差扩大到 0.9,也就是说量化的位阶越少,量化的间隔就越大,量化噪音也就越大。
我们做一个实验,把 16bit 的声波档转为 8bit,当场丢掉一半的资讯,档案也就小了一半,最简单的失真压缩不过我们观察频谱发现,减少量化的 bit 数产生的量化噪音,会造成全频带都水平上升一定杂讯,你如果听这个 8bit 的声波档,会发现背景充满沙沙沙的噪音,这就是因为量化误差产生的量化噪音。
那我们会想,这样全频带都减少一定的 bit 数太没有效率,为什么不把他分成好几个频带(critical band),再根据人耳的心理声学模型的遮蔽效应,对不同频带分配不同的 bit 数,让各个频带产生的量化噪音低于遮蔽效应的曲线以下,这样这些产生的量化噪音我们就听不到,对知觉来说等于是无失真压缩,这样岂不更好?

所以我们就把压缩的工作分成两个部分,一个部分将原来的 PCM data 经过 band pass filter 分成好几个 subband 次频带,另一个部分就是心理声学模型,分析频谱,找出遮蔽效应的曲线,然后根据这个曲线,对每个 subband 分别量化,决定分配的 bit 数,让产生的量化噪讯低于遮蔽效应的曲线,使量化的失真不会被人耳听到,这样就大功告成了

然后接下来要说的就是这个最复杂的心理声学模型是怎么工作的.... ^^;

怎么讲一讲变成这麼长 ^^;;
都还没进入主题...
我是要解释什么是 scale factor,这个牵扯到量化的过程,还有 short block 和 long block,这个牵扯到心理声学模型的判断和 MDCT window 大小的转换,主要目的是解决 pre-echo 的问题,结果越讲越多... ><
看的人就忍耐一下吧... -_-;;;

前面说到心理声学模型是如何工作的。ISO MPEG1 Audio 提供了两个心理声学模型,分别是 psychoacoustic model 1 和 2,model 2 比 model 1 要来得复杂,但是判断的效果较好。两个声学模型可以用在任何一个 layer,layer 1~3(MPEG1 layer 3 = MP3)。不过我们通常是将 model 1 用在 MP1 和 MP2,model 2 用在 MP3。不过当然也有例外,譬如说有一个特殊版本的 toolame(压 MP1, MP2 最好的 encoder)就是改用 model 2 的心理声学模型而不用 model 1。
MPEG1 Audio 压缩的时候一边是用一个 polyphase filter bank,将 PCM data 分成好几个"等宽的" subband 等待进一步量化压缩,一边是 psychoacoustic model,使用 512(MP1)或 1024(MP2/MP3)point(取 512/1024 个 sample 计算,或者说 window size=512/1024)的 FFT 转换,将 PCM data 转换到频率域,进行频谱分析。之所以另外使用 FFT 来分析,是因为 FFT 有比较好的频率分辨率,计算各个频率的遮蔽效应时会比较精确。然后 psychoacoustic model 会将频率按照 critical band(人耳听觉特性的频带)分为好几组,计算各个 critical band 的遮蔽曲线。在计算遮蔽曲线时,第一件要做的工作是区分哪些频率的声音是 tone,哪些频率的声音是 noise。为什么要这麼区分呢?因为根据实验发现这两种声音的遮蔽能力不一样,noise 具有比 tone 更强的遮蔽效应。这边会提到两个名词,一个是 TMN(Tone Mask Noise),tone 遮蔽 noise 的能力,单位是 dB,比较弱,另一个是 NMT(Noise Mask Tone),noise 遮蔽 tone 的能力,比较强。这两个名词很眼熟吗?MP+/MPC 就有提供让使用者修改这两个参数的设定。调降这两个参数,会减低 tone 和 noise 的遮蔽能力,整个遮蔽曲线会往下降,可以容忍的量化噪音就比较低,量化噪音必须减少,分配的 bit 数就必须增加,所以 MP+/MPC 调低这两个参数,bitrate 会往上窜升,但是量化杂讯也会随之减少。

在判断哪些声音是 tone,哪些声音是 noise,model 1 和 model 2 采用不同的方法。model 1 是寻找区域范围内,音量最大的频率,把这个频率当作 tone,因为 tone 通常是一定的区域范围内音量最大的。其他剩下的部分就当成是 noise,加起来以一个单一的频率代表。
model 2 的作法则不是去区分 tone 和 non-tone(noise),而是给每个频率一个 tone index,由 0~1,index 数字越大,代表这个频率越像 tone,根据这个 index 的比例大小,分别计算他们的遮蔽影响力,这样是不是更精确呢。那要怎么判断某个频率有多像 tone 呢? model 2 是用 predict 的方法。predict 的意思是以现在的状态,去预测下一个状态是什么。在这里 model 2 会储存过去的两个分析过的 window 频谱,根据频谱的变化,来判断哪些频率有多像 tone。因为 tone 的声音会具有可预测性,前后的变化会有高度的关联性,不会随机的杂乱跳动。根据前后的频谱变化,model 2 更可以准确的分办出 tone 和 noise。

找出 tone 和 noise 以后,接着把不重要没有意义的 tone/noise 去掉,譬如说两个 tone 靠近,一强一弱,或是低于 ATH 绝对听觉极限以下的 tone/noise,都可以把他去掉。然后计算剩下来的 tone/noise 的遮蔽效应,求出每个 critical band 的遮蔽曲线,最后在合并这些曲线,找出全体的遮蔽曲线。
实际上 psychoacoustic model 会计算一个数值,然后把这个数值传给量化阶段的程式,让量化阶段的程式知道这个频带可以允许的量化噪音是多少,该分配多少的 bit 数。这个传给量化程式的参数叫做 SMR(Signal to Mask Ratio)。
很眼熟的名词对不对
SMR=SNR-NMR
MP+/MPC/Lame 可以让你自行设定 minimum SMR 的底线是多少。
前面提过,MPEG1 Audio 在分成好几个 subband 准备做量化的时候,用的是"等宽"的 filter bank,这和我们人耳特性的 critical band 不同,由下图可以看出,低频的部分一个 subband,包含了好几个 critical band。到了高频的时候,好几个 subband 包含在一个 critical band 里面。这样心理声学模型计算出来的各个 critical band 的 SMR 要怎么给呢?
model 1 是取 subband 涵盖的范围中,最小的 SMR。这麼做在低频的时候,会将好几个 critical band 的 SMR 取其最小的一个给 subband,因为 subband 包含了好几个 critical band,如果用这几个 critical band 中最大的 SMR,将会有部分频率的遮蔽效应会估计错误,所以为了妥协,只好取最小的。高频的时候则是好几个 subband 共用一个 SMR。model 1 有一个致命伤,就是高频的时候,前面我们说过 model 1 每个 critical band 的 noise 是以一个总和集中的频率代表,现在这个 critical band 横跨好几个 subband,以这个中央代表的 noise 频率计算出来的 SMR,就无法适用在每个 subband 里面。(距离中央越远的就越不正确)
model 2 低频的时候取最小的 SMR,和 model 1 一样,高频的时候则是取 critical band 好几个 SMR 的平均值给 subband。model 2 不用集中式的 noise,而是用 tone index 的方式来计算 tone 和 noise 的遮蔽效应,所以在高频的时候会比 model 1 精确。

好了,心理声学模型不能再讲下去了,头晕了... @_@

图... 有机会再补 ^^;

终于进入主题了:MDCT 和 Quantization(量化)。
前面提到我们将 PCM data 分成好几个 subband 等待心理声学模型的判断,做进一步的量化压缩,这种压缩法我们叫做 subband coding。这个 filter 我们用的是 polyphase filter bank,将 PCM data 分成 32 个等宽的 subband。这个 ployphase filter bank 有几个缺点:
1. 它是有失真的 filter,也就是说,还没有做会失真的量化步骤,经过 filtering 以后的 subsample 立刻将它还原回 PCM data,结果就已经和原来不一样了。不过这个失真很小(小于 0.07dB)所以对品质不会有太大的伤害。
2. 它是等宽的频带,不符合人耳听觉特性的 critical band,对后续量化阶段的处理不利
3. 它的截止点平缓,所以当输入频率很靠近截止点的时候,相邻的两个 subband 会发生 aliasing(或者说 overlap,.....请看图...有机会再补....-_-;;)

MP1 一个 frame 384 个 sample,MP2 和 MP3 用 1152 个 sample,而且 MP3 会将 polyphase filter bank 切出来的 32 个 subband 的 sample,再用 MDCT 转换,进一步划分成更细的频带,提高对频率的分辨率。这个将原本资料转换到另一个空间之后再进行压缩的方法,我们称为 transform coding。因为MP3 混合了 subband filterbank 和 MDCT,所以我们把 MP3 的这个 filtering 的过程称为 Hybird Filterbank。
MDCT 之后,可以运用 butterfly 的计算,消除 polyphase filter bank 产生的 aliasing。
不过成也 MDCT 败也 MDCT,经过这个 MDCT 转换之后,资料会完全丧失时间的资讯。什么是丧失时间资讯?我们回头来说 FFT。
做 FFT 计算的时候,window size 越大(取进来计算的 sample 越多),对频率的分解能越强,频率的计算越精确。但是这些 PCM data 的 sample 是照时间排列的,对 44.1KHz 的 PCM 一次取 32768 个 sample 进来计算,如果不用 overlap,则你的频率分辨率(ie. spectral line resolution)是 1.346Hz,而时间分辨率只有 1sec * 32768/44100 = 743.04msec,你看不到小于 735.61msec 的频率变化的过程。频率分辨率和时间分辨率两个量无法同时求得精确的值,时间越精确(取进来计算的 sample 越少),频率解析就越差,频率越精确(取进来计算的 sample 越多),时间解析就越差。
MP3 经由 polyphase filter bank 之后转 MDCT 的过程如下
1. 1152 个 PCM sample 分成两个部分,各 576 个 sample,称为一个 granule。
2. 这 576 个 sample 送进 polyphase filter bank,输出 32 sample(按频率顺序)x 18 组(按时间排序)
3. 重排为 18 个 sample(按时间排序)x 32 组(按频率排序)
4. 每一组中的 18 个 sample 为时间顺序,加上前面一次转换的 18 个 sample,总共 36 个 sample 送进去做 MDCT 转换(所以 MDCT window 有 50% 的 overlap 重叠)
5. 转出来为 18 个 sepctral line(按频率排序)x 32 组(按频率排序)

好复杂吗? ^^;
总之 MDCT 转换完以后,时间资讯就不见了(每一个都是 spectral line,都是频率资讯,不过频率资讯更细了)。
丢掉时间资讯会有什么影响呢?
假设现在转换的这一块声音区块前面是很微弱的声音,到后面突然出现音量急遽升高的情形,譬如说鼓手突然开始打鼓,这种波形我们称为“attack”:突然拉起的波形。遇到这种情况心理声学模型会很笨的认为这个区块里面有很强的 masker,可以提供很高的遮蔽曲线,所以可以允许较大的量化失真,因此量化的步骤就会给比较少的 bit。MDCT 一次转换就是取 576 个 sample,这个 block 的长度,同时也就是时间的长度,所以一次死就死全部的 block,量化失真产生的 noise 会扩散到整个 block 的长度范围(也就是时间范围),所以前面声音很微弱的区段,也会发生这些量化噪音,想当然尔,原来微弱的音量根本无法遮蔽掉这些量化噪音,如果后面大音量区段的 pre-masking 前遮蔽曲线也不够遮蔽这些 noise,我们就会听到这些量化噪音了,那么心理声学模型也就破功了。
这种压缩瑕疵叫做 pre-echo。

这个道理类似 JPEG 图档的压缩瑕疵,JPEG 一次转换是拿 8x8 的区块去做 DCT 转换,遇到区块内包含锐利的边缘、线条(有很多的高频成分)的时候,经过 DCT 转换,高频的量化失真会扩散到整个 8x8 的像素区块,所以我们常常看到 JPEG 或 MPEG 档案画面上锐利线条的周围(譬如说文字的周围)会有那种斑斑点点,破碎的压缩瑕疵,这就是因为一次死死全部,整个区块都完蛋的关系。

MP+/MPC 因为不用 transform coding,不做 MDCT 转换,所以他的 pre-echo 的问题比较小,观察 MPC 压出来的波形,几乎看不到 pre-echo 的压缩瑕疵。
一个相反的例子,MPEG2 AAC/MPEG4 AAC 完全不用 subband filterbank,直接做 MDCT 转换(前置有一个 gain-control),不过 AAC 有一套对付 pre-echo 的 tool(或者叫 mole)叫做 TNS,可以用来解决 pre-echo 的问题。

这个,越扯越远,写不完了 ><
解决 pre-echo 的方法下次继续....

㈡ 怎么用fft快速傅立叶变换处理pcm,做到消去人声

不需要用到FFT,左右声道数据相减,就行了。因为一般来说,音乐在左右声道不同而人声相同。

㈢ 如何有效地无损压缩二进制数据

基本的分为两大类:有损和无损。
有损压缩:主要是一些量化算法,比如a率,u率,lloyds最优量化。
无损压缩:主要是一些编码算法,比如子带编码,差分编码,哈夫曼编码等。
另外时频变换虽然没压缩效果,但是是很好的压缩工具,比如fft,dct等。
最后就是压缩感知稀疏重建等。

㈣ 快速傅里叶转化(FFT)中幅值图的意义是什么

http://wenku..com/view/3b5fe264f5335a8102d22076.html 同在找这个问题的解释, 这个有点帮助

㈤ 示波器的FFT运算有什么作用

示波器的FFT运算就是快速傅里叶变换,通过傅里叶变换可实现实现时域信号和频域信号的转换,展示出时域信号的频率构成。每一个波形都可以被分解成不同频率、幅值正弦波叠加,FFT运算得到的频率点都是方波分出的谐波分量的频率。

FFT运算功能的作用就是测试滤波器和系统的脉冲响应;分辨和定位噪声干扰源,确定乱真辐射;分析抖动、谐波功率、EMI;由于FFT运算需进行大量的数据处理,所以很多示波器在进行FFT运算的时容易出现卡的现象。

㈥ 求助:实数序列FFT变换的C语言代码

多谢兄台的分享mmxxrkyy 能率热水器维修空气能热水器的原理是:通过压缩机系统运转工作,吸收空气中热量制造热水。具体过程是:压缩机将冷媒压缩,压缩后温度升高的冷媒,经过水箱中的冷凝器制造热水。热交换后的冷媒回到压缩机进行下一循环。樱花热水器维修在这一过程中,空气热量通过蒸发器被吸收导入水中,产生热水。这样的通过压缩机空气制热的新一代热水器。

㈦ 为什么FFT和数字滤波器会成为数字信号处理的核心基础内容应该是从应用方面来说,请高手指教。

1、FFT是应用极为广泛,同时也是非常可靠的信号分解方法。信号处理的一个重要内容就是对信号进行分解,以便观察信号有哪些分量,各分量又具有什么样的特征。另外,很多新的信号处理方法都是以FFT为理论基础的。
2、从应用的角度说,数字滤波器是对信号实现快速去噪、分检的途径。而且,滤波器是一个广义的概念,对信号进行压缩(解压)的算法也就是一种滤波器:比如图像、视频流。所以,数字信号处理中所介绍的滤波器设计的内容才成为核心内容。

㈧ FFT的用途有哪些

快速傅里叶变换(FFT)主要用于频谱分析,将时域信号转化为频域信号,在故障诊断领域有广泛的应用,因为每种故障有自己独特的频率成分,如质量不平衡表现为一倍频较大,不对中表现为二倍频较大,等等。此外,在滤波、图象处理和数据压缩等领域也有普遍应用。

㈨ 详细介绍一下有关硬件术语的全称

计算机英文术语完全介绍
1、CPU
3DNow!(3D no waiting)
ALU(Arithmetic Logic Unit,算术逻辑单元)
AGU(Address Generation Units,地址产成单元)
BGA(Ball Grid Array,球状矩阵排列)
BHT(branch prediction table,分支预测表)
BPU(Branch Processing Unit,分支处理单元)
Brach Pediction(分支预测)
CMOS(Complementary Metal Oxide Semiconctor,互补金属氧化物半导体)
CISC(Complex Instruction Set Computing,复杂指令集计算机)
CLK(Clock Cycle,时钟周期)
COB(Cache on board,板上集成缓存
COD(Cache on Die,芯片内集成缓存)
CPGA(Ceramic Pin Grid Array,陶瓷针型栅格数组)
CPU(Center Processing Unit,中央处理器)
Data Forwarding(数据前送)
Decode(指令译码)
DIB(Dual Independent Bus,双独立总线)
EC(Embedded Controller,嵌入式控制器)
Embedded Chips(嵌入式处理器)
EPIC(explicitly parallel instruction code,并行指令代码)
FADD(Floationg Point Addition,浮点加)
FCPGA(Flip Chip Pin Grid Array,反转芯片针脚栅格数组)
FDIV(Floationg Point Divide,浮点除)
FEMMS(Fast Entry/Exit Multimedia State,快速进入/退出多媒体状态)
FFT(fast Fourier transform,快速热奥姆转换)
FID(FID:Frequency identify,频率鉴别号码)
FIFO(First Input First Output,先入先出队列)
flip-chip(芯片反转)
FLOP(Floating Point Operations Per Second,浮点操作/秒)
FMUL(Floationg Point Multiplication,浮点乘)
FPU(Float Point Unit,浮点运算单元)
FSUB(Floationg Point Subtraction,浮点减)
HL-PBGA(表面黏着,高耐热、轻薄型塑料球状矩阵封装)
IA(Intel Architecture,英特尔架构)
ICU(Instruction Control Unit,指令控制单元)
ID(identify,鉴别号码)
IDF(Intel Developer Forum,英特尔开发者论坛)
IEU(Integer Execution Units,整数执行单元)
IMM(Intel Mobile Mole,英特尔移动模块)
Instructions Cache(指令缓存)
Instruction Coloring(指令分类)
IPC(Instructions Per Clock Cycle,指令/时钟周期)
ISA(instruction set architecture,指令集架构)
KNI(Katmai New Instructions,Katmai新指令集,即SSE)
Latency(潜伏期)
LDT(Lightning Data Transport,闪电数据传输总线)
Local Interconnect(局域互连)
MESI(Modified,Exclusive,Shared,Invalid:修改、排除、共享、废弃)
MMX(MultiMedia Extensions,多媒体扩展指令集)
MMU(Multimedia Unit,多媒体单元)
MFLOPS(Million Floationg Point/Second,每秒百万个浮点操作)
MHz(Million Hertz,兆赫兹)
MP(Multi-Processing,多重处理器架构)
MPS(MultiProcessor Specification,多重处理器规范)
MSRs(Model-Specific Registers,特别模块寄存器)
NAOC(no-account OverClock,无效超频)
NI(Non-Intel,非英特尔)
OLGA(Organic Land Grid Array,基板栅格数组)
OoO(Out of Order,乱序执行)
PGA(Pin-Grid Array,引脚网格数组,耗电大)
PR(Performance Rate,性能比率)
PSN(Processor Serial numbers,处理器序列号)
PIB(Processor In a Box,盒装处理器)
PPGA(Plastic Pin Grid Array,塑料针状矩阵封装)
PQFP(Plastic Quad Flat Package,塑料方块平面封装)
RAW(Read after Write,写后读)
Register Contention(抢占寄存器)
Register Pressure(寄存器不足)
Register Renaming(寄存器重命名)
Remark(芯片频率重标识)
Resource contention(资源冲突)
Retirement(指令引退)
RISC(Reced Instruction Set Computing,精简指令集计算机)
SEC(Single Edge Connector,单边连接器)
Shallow-trench isolation(浅槽隔离)
SIMD(Single Instruction Multiple Data,单指令多数据流)
SiO2F(Fluorided Silicon Oxide,二氧氟化硅)
SMI(System Management Interrupt,系统管理中断)
SMM(System Management Mode,系统管理模式)
SMP(Symmetric Multi-Processing,对称式多重处理架构)
SOI(Silicon-on-insulator,绝缘体硅片)
SONC(System on a chip,系统集成芯片)
SPEC(System Performance Evaluation Corporation,系统性能评估测试)
SQRT(Square Root Calculations,平方根计算)
SSE(Streaming SIMD Extensions,单一指令多数据流扩展)
Superscalar(超标量体系结构)
TCP(Tape Carrier Package,薄膜封装,发热小)
Throughput(吞吐量)
TLB(Translate Look side Buffers,翻译旁视缓冲器)
USWC(Uncacheabled Speculative Write Combination,无缓冲随机联合写操作)
VALU(Vector Arithmetic Logic Unit,向量算术逻辑单元)
VLIW(Very Long Instruction Word,超长指令字)
VPU(Vector Permutate Unit,向量排列单元)
VPU(vector processing units,向量处理单元,即处理MMX、SSE等SIMD指令的地方)
2、主板
ADIMM(advanced Dual In-line Memory Moles,高级双重内嵌式内存模块)
AMR(Audio/Modem Riser;音效/调制解调器主机板附加直立插卡)
AHA(Accelerated Hub Architecture,加速中心架构)
ASK IR(Amplitude Shift Keyed Infra-Red,长波形可移动输入红外线)
ATX(AT Extend,扩展型AT)
BIOS(Basic Input/Output System,基本输入/输出系统)
CSE(Configuration Space Enable,可分配空间)
DB(Device Bay,设备插架)
DMI(Desktop Management Interface,桌面管理接口)
EB(Expansion Bus,扩展总线)
EISA(Enhanced Instry Standard Architecture,增强形工业标准架构)
EMI(Electromagnetic Interference,电磁干扰)
ESCD(Extended System Configuration Data,可扩展系统配置数据)
FBC(Frame Buffer Cache,帧缓冲缓存)
FireWire(火线,即IEEE1394标准)
FSB(Front Side Bus,前置总线,即外部总线)
FWH( Firmware Hub,固件中心)
GMCH(Graphics & Memory Controller Hub,图形和内存控制中心)
GPIs(General Purpose Inputs,普通操作输入)
ICH(Input/Output Controller Hub,输入/输出控制中心)
IR(infrared ray,红外线)
IrDA(infrared ray,红外线通信接口可进行局域网存取和档共享)
ISA(Instry Standard Architecture,工业标准架构)
ISA(instruction set architecture,工业设置架构)
MDC(Mobile Daughter Card,移动式子卡)
MRH-R(Memory Repeater Hub,内存数据处理中心)
MRH-S(SDRAM Repeater Hub,SDRAM数据处理中心)
MTH(Memory Transfer Hub,内存转换中心)
NGIO(Next Generation Input/Output,新一代输入/输出标准)
P64H(64-bit PCI Controller Hub,64位PCI控制中心)
PCB(printed circuit board,印刷电路板)
PCBA(Printed Circuit Board Assembly,印刷电路板装配)
PCI(Peripheral Component Interconnect,互连外围设备)
PCI SIG(Peripheral Component Interconnect Special Interest Group,互连外围设备专业组)
POST(Power On Self Test,加电自测试)
RNG(Random number Generator,随机数字发生器)
RTC(Real Time Clock,实时时钟)
KBC(KeyBroad Control,键盘控制器)
SBA(Side Band Addressing,边带寻址)
SMA(Share Memory Architecture,共享内存结构)
STD(Suspend To Disk,磁盘唤醒)
STR(Suspend To RAM,内存唤醒)
SVR(Switching Voltage Regulator,交换式电压调节)
USB(Universal Serial Bus,通用串行总线)
USDM(Unified System Diagnostic Manager,统一系统监测管理器)
VID(Voltage Identification Definition,电压识别认证)
VRM (Voltage Regulator Mole,电压调整模块)
ZIF(Zero Insertion Force,零插力)
主板技术
技嘉
ACOPS: Automatic CPU OverHeat Prevention System(CPU过热预防系统)
SIV: System Information Viewer(系统信息观察)
盘英
ESDJ(Easy Setting Dual Jumper,简化CPU双重跳线法)
浩鑫
UPT(USB、PANEL、LINK、TV-OUT四重界面)
芯片组
ACPI(Advanced Configuration and Power Interface,先进设置和电源管理)
AGP(Accelerated Graphics Port,图形加速接口)
I/O(Input/Output,输入/输出)
MIOC(Memory and I/O Bridge Controller,内存和I/O桥控制器)
NBC(North Bridge Chip,北桥芯片)
PIIX(PCI ISA/IDE Accelerator,加速器)
PSE36(Page Size Extension 36-bit,36位页面尺寸扩展模式)
PXB(PCI Expander Bridge,PCI增强桥)
RCG(RAS/CAS Generator,RAS/CAS发生器)
SBC(South Bridge Chip,南桥芯片)
SMB(System Management Bus,全系统管理总线)
SPD(Serial Presence Detect,内存内部序号检测装置)
SSB(Super South Bridge,超级南桥芯片)
TDP(Triton Data Path,数据路径)
TSC(Triton System Controller,系统控制器)
QPA(Quad Port Acceleration,四界面加速)
3、显示设备
ASIC(Application Specific Integrated Circuit,特殊应用集成电路)
ASC(Auto-Sizing and Centering,自动调效屏幕尺寸和中心位置)
BLA(Bearn Landing Area,电子束落区)
CRC(Cyclical Rendancy Check,循环冗余检查)
CRT(Cathode Ray Tube,阴极射线管)
DDC(Display Data Channel,显示数据信道)
DFL(Dynamic Focus Lens,动态聚焦)
DFS(Digital Flex Scan,数字伸缩扫描)
DIC(Digital Image Control,数字图像控制)
Digital Multiscan II(数字式智能多频追踪)
DLP(digital Light Processing,数字光处理)
DOSD(Digital On Screen Display,同屏数字化显示)
DPMS(Display Power Management Signalling,显示能源管理信号)
DQL(Dynamic Quadrapole Lens,动态四极镜)
DSP(Digital Signal Processing,数字信号处理)
EFEAL(Extended Field Elliptical Aperture Lens,可扩展扫描椭圆孔镜头)
FRC(Frame Rate Control,帧比率控制)
LCD(liquid crystal display,液晶显示屏)
LCOS(Liquid Crystal On Silicon,硅上液晶)
LED(light emitting diode,光学二级管)
L-SAGIC(Low Power-Small Aperture G1 wiht Impregnated Cathode,低电压光圈阴极管)
LVDS(Low Voltage Differential Signal,低电压差动信号)
MALS(Multi Astigmatism Lens System,多重散光聚焦系统)
MDA(Monochrome Adapter,单色设备)
MS(Magnetic Sensors,磁场感应器)
Porous Tungsten(活性钨)
RSDS(Reced Swing Differential Signal,小幅度摆动差动信号)
Shadow Mask(阴罩式)
TDT(Timeing Detection Table,资料测定表)
TICRG(Tungsten Impregnated Cathode Ray Gun,钨传输阴级射线枪)
TFT(thin film transistor,薄膜晶体管)
VAGP(Variable Aperature Grille Pitch,可变间距光栅)
VBI(Vertical Blanking Interval,垂直空白间隙)
VDT(Video Display Terminals,视频显示终端)
VRR(Vertical Refresh Rate,垂直扫描频率)
4、视频
3D(Three Dimensional,三维)
3DS(3D SubSystem,三维子系统)
AE(Atmospheric Effects,雾化效果)
AFR(Alternate Frame Rendering,交替渲染技术)
Anisotropic Filtering(各向异性过滤)
APPE(Advanced Packet Parsing Engine,增强形帧解析引擎)
AV(Analog Video,模拟视频)
Back Buffer(后置缓冲)
Backface culling(隐面消除)
Battle for Eyeballs(眼球大战,各3D图形芯片公司为了争夺用户而作的竞争)
Bilinear Filtering(双线性过滤)
CG(Computer Graphics,计算机生成图像)
Clipping(剪贴纹理)
Clock Synthesizer(时钟合成器)
compressed textures(压缩纹理)
Concurrent Command Engine(协作命令引擎)
Center Processing Unit Utilization(中央处理器占用率)
DAC(Digital to Analog Converter,数模传换器)
Decal(印花法,用于生成一些半透明效果,如:鲜血飞溅的场面)
DFP(Digital Flat Panel,数字式平面显示器)
DFS: Dynamic Flat Shading(动态平面描影,可用作加速)
Dithering(抖动)
Directional Light(方向性光源)
DME: Direct Memory Execute(直接内存执行)
DOF(Depth of Field,多重境深)
dot texture blending(点型纹理混和)
Double Buffering(双缓冲区)
DIR(Direct Rendering Infrastructure,基层直接渲染)
DVI(Digital Video Interface,数字视频接口)
DxR(DynamicXTended Resolution,动态可扩展分辨率)
DXTC(Direct X Texture Compress,DirectX纹理压缩,以S3TC为基础)
Dynamic Z-buffering(动态Z轴缓冲区),显示物体远近,可用作远景
E-DDC(Enhanced Display Data Channel,增强形视频数据信道协议,定义了显示输出与主系统之间的通讯信道,能提高显示输出的画面质量)
Edge Anti-aliasing(边缘抗锯齿失真)
E-EDID(Enhanced Extended Identification Data,增强形扩充身份辨识数据,定义了计算机通讯视频主系统的数据格式)
Execute Buffers(执行缓冲区)
environment mapped bump mapping(环境凹凸映射)
Extended Burst Transactions(增强式突发处理)
Front Buffer(前置缓冲)
Flat(平面描影)
Frames rate is King(帧数为王)
FSAA(Full Scene Anti-aliasing,全景抗锯齿失真)
Fog(雾化效果)
flip double buffered(反转双缓存)
fog table quality(雾化表画质)
GART(Graphic Address Remappng Table,图形地址重绘表)
Gouraud Shading(高洛德描影,也称为内插法均匀涂色)
GPU(Graphics Processing Unit,图形处理器)
GTF(Generalized Timing Formula,一般程序时间,定义了产生画面所需要的时间,包括了诸如画面刷新率等)
HAL(Hardware Abstraction Layer,硬件抽像化层)
hardware motion compensation(硬件运动补偿)
HDTV(high definition television,高清晰度电视)
HEL: Hardware Emulation Layer(硬件模拟层)
high triangle count(复杂三角形计数)
5、音频
3DPA(3D Positional Audio,3D定位音频)
AC(Audio Codec,音频多媒体数字信号编译码器)
Auxiliary Input(辅助输入接口)
CS(Channel Separation,声道分离)
DS3D(DirectSound 3D Streams)
DSD(Direct Stream Digital,直接数字信号流)
DSL(Down Loadable Sample,可下载的取样音色)
DLS-2(Downloadable Sounds Level 2,第二代可下载音色)
EAX(Environmental Audio Extensions,环境音效扩展技术)
FM(Frequency Molation,频率调制)
FR(Frequence Response,频率响应)
FSE(Frequency Shifter Effect,频率转换效果)
HRTF(Head Related Transfer Function,头部关联传输功能)
IAS(Interactive Around-Sound,交互式环绕声)
MIDI(Musical Instrument Digital Interface,乐器数字接口)
NDA(non-DWORD-aligned ,非DWORD排列)
Raw PCM: Raw Pulse Code Molated(元脉码调制)
RMA(RealMedia Architecture,实媒体架构)
RTSP(Real Time Streaming Protocol,实时流协议)
SACD(Super Audio CD,超级音乐CD)
SNR(Signal to Noise Ratio,信噪比)
S/PDIF(Sony/Phillips Digital Interface,索尼/飞利普数字接口)
SRS(Sound Retrieval System,声音修复系统)
Super Intelligent Sound ASIC(超级智慧音频集成电路)
THD+N(Total Harmonic Distortion plus Noise,总谐波失真加噪音)
QEM(QSound Environmental Modeling,QSound环境建模)
WG(Wave Guide,波导合成)
WT(Wave Table,波表合成)
6、RAM&ROM
ABP(Address Bit Permuting,地址位序列改变)
ATC(Access Time from Clock,时钟存取时间)
BSRAM(Burst pipelined synchronous static RAM,突发式管道同步静态内存)
CAS(Column Address Strobe,列地址控制器)
CCT(Clock Cycle Time,时钟周期)
DB(Deep Buffer,深度缓冲)
DDR SDRAM(Double Date Rate,双数据率SDRAM)
DIL(al-in-line)
DIMM(Dual In-line Memory Moles,双重内嵌式内存模块)
DRAM(Dynamic Random Access Memory,动态随机内存)
DRDRAM(Direct RAMbus DRAM,直接RAMbus内存)
ECC(Error Checking and Correction,错误检查修正)
EEPROM(Electrically Erasable Programmable ROM,电擦写可编程只读存储器)
FM(Flash Memory,闪存)
FMD ROM (Fluorescent Material Read Only Memory,荧光质只读存储器)
PIROM(Processor Information ROM,处理器信息ROM)
PLEDM(Phase-state Low Electron(hole)-number Drive Memory)
RAC(Rambus Asic Cell,Rambus集成电路单元)
RAS(Row Address Strobe,行地址控制器)
RDRAM(Rambus Direct RAM,直接型RambusRAM)
DIMM(RAMBUS In-line Memory Moles,RAMBUS内嵌式内存模块)
SDR SDRAM(Single Date Rate,单数据率SDRAM)
SGRAM(synchronous graphics RAM,同步图形随机储存器)
SO-DIMM(Small Outline Dual In-line Memory Moles,小型双重内嵌式内存模块)
SPD(Serial Presence Detect,串行存在检查)
SRAM(Static Random Access Memory,静态随机内存)
SSTL-2(Stub Series Terminated Logic-2)
TSOPs(thin small outline packages,超小型封装)
USWV(Uncacheable,Speculative,Write-Combining非缓冲随机混合写入)
VCMA(Virtual Channel Memory architecture,虚拟信道内存结构)
7、磁盘
AAT(Average access time,平均存取时间)
ABS(Auto Balance System,自动平衡系统)
ASMO(Advanced Storage Magneto-Optical,增强形光学内存)
AST(Average Seek time,平均寻道时间)
ATA(AT Attachment,AT扩展型)
ATOMM(Advanced super Thin-layer and high-Output Metal Media,增强形超薄高速金属媒体)
bps(bit per second,位/秒)
CSS(Common Command Set,通用指令集)
DMA(Direct Memory Access,直接内存存取)
DVD(Digital Video Disk,数字视频光盘)
EIDE(enhanced Integrated Drive Electronics,增强形电子集成驱动器)
FAT(File Allocation Tables,文件分配表)
FDBM(Fluid dynamic bearing motors,液态轴承马达)
FDC(Floppy Disk Controller,软盘驱动器控制装置)
FDD(Floppy Disk Driver,软盘驱动器)
GMR(giant magnetoresistive,巨型磁阻)
HDA(head disk assembly,磁头集合)
HiFD(high-capacity floppy disk,高容量软盘)
IDE(Integrated Drive Electronics,电子集成驱动器)
LBA(Logical Block Addressing,逻辑块寻址)
MBR(Master Boot Record,主引导记录)
MTBF(Mean Time Before Failure,平均故障时间)
PIO(Programmed Input Output,可编程输入输出模式)
PRML(Partial Response Maximum Likelihood,最大可能部分反应,用于提高磁盘读写传输率)
RPM(Rotation Per Minute,转/分)
RSD(Removable Storage Device,移动式存储设备)
SCSI(Small Computer System Interface,小型计算机系统接口)
SCMA(SCSI Configured Auto Magically,SCSI自动配置)
S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology,自动监测、分析和报告技术)
SPS(Shock Protection System,抗震保护系统)
Ultra DMA(Ultra Direct Memory Access,超高速直接内存存取)
LVD(Low Voltage Differential)
Seagate硬盘技术
DiscWizard(磁盘控制软件)
DST(Drive Self Test,磁盘自检程序)
SeaShield(防静电防撞击外壳)
8、光驱
ATAPI(AT Attachment Packet Interface)
BCF(Boot Catalog File,启动目录文件)
BIF(Boot Image File,启动映射档)
CDR(CD Recordable,可记录光盘)
CD-ROM/XA(CD-ROM eXtended Architecture,只读光盘增强形架构)
CDRW(CD-Rewritable,可重复刻录光盘)
CLV(Constant Linear Velocity,恒定线速度)
DAE(digital Audio Extraction,资料音频抓取)
DDSS(Double Dynamic Suspension System,双悬浮动态减震系统)
DDSS II(Double Dynamic Suspension System II,第二代双层动力悬吊系统)
PCAV(Part Constant Angular Velocity,部分恒定角速度)
VCD(Video CD,视频CD)
9、打印机
AAS(Automatic Area Seagment?)
dpi(dot per inch,每英寸的打印像素)
ECP(Extended Capabilities Port,延长能力端口)
EPP(Enhanced Parallel Port,增强形并行接口)
IPP(Internet Printing Protocol,因特网打印协议)
ppm(paper per minute,页/分)
SPP(Standard Parallel Port,标准并行口)
TET(Text Enhanced Technology,文本增强技术)
USBDCDPD(Universal Serial Bus Device Class Definition for Printing Devices,打印设备的通用串行总线级标准)
VD(Variable Dot,变点式打印)
10、扫描仪
TWAIN(Toolkit Without An Interesting Name,协议)

㈩ 有损压缩算法

基本的分为两大类:有损和无损。
有损压缩:主要是一些量化算法,比如a率,u率,lloyds最优量化。
无损压缩:主要是一些编码算法,比如子带编码,差分编码,哈夫曼编码等。
另外时频变换虽然没压缩效果,但是是很好的压缩工具,比如fft,dct等。
最后就是压缩感知稀疏重建等。
由于信息丢失意味着在误差和比特率之间进行一些权衡,我们首先考虑失真度量---例如,平方误差。本文引入了不同的量化器,每个量化器都具有不同的失真行为。许多有损数据压缩算法开发的数学基础是随机过程的研究。

介绍:

当图像直方图相对平坦时,使用无损压缩技术(例如,霍夫曼编码,算术编码,LZW)的图像数据的压缩比较低。对于需要更高压缩比的多媒体应用中的图像压缩,通常采用有损方法。在有损压缩中,压缩图像通常与原始图像不同,但在感知上与原始图像近似。为了定量描述近似值与原始数据的接近程度,需要某种形式的失真度量。

失真测量:

失真度量是一种数学量,它使用一些失真标准指定近似值与其原始值的接近程度。在查看压缩数据时,很自然地会根据原始数据和重建数据之间的数值差异来考虑失真。 然而,当要压缩的数据是图像时,这样的度量可能不会产生预期的结果。

例如,如果重建的图像与原始图像相同,只是它被向右移动一条垂直扫描线,那么普通的人类观察者将难以将其与原始图像区分开,因此可以得出结论:失真很小。 然而,当以数字方式执行计算时,由于重建图像的各个像素的大的变化,我们发现大的失真。问题是我们需要一种感知失真的测量,而不是一种更天真的数值方法。然而,对感知扭曲的研究超出了本书的范围。

在已经定义的许多数值失真度量中,我们提出了图像压缩中最常用的三种。如果我们对平均像素差异感兴趣,则经常使用均方误差(MSE)。 它被定义为

热点内容
sqlserver2005数据恢复 发布:2024-10-12 01:04:09 浏览:515
远程访问磁盘 发布:2024-10-12 00:59:16 浏览:475
glc低配有哪些配置 发布:2024-10-12 00:38:23 浏览:950
网关无法解析服务器的DNS地址 发布:2024-10-12 00:33:38 浏览:279
windowsmysql自动备份脚本 发布:2024-10-12 00:33:37 浏览:187
写短视频的脚本的人 发布:2024-10-12 00:33:36 浏览:963
云存储免费的摄像头 发布:2024-10-12 00:15:47 浏览:621
DA与脚本 发布:2024-10-12 00:14:22 浏览:255
如何看配置支不支持黑苹果 发布:2024-10-12 00:13:45 浏览:588
固件怎么编译 发布:2024-10-12 00:05:48 浏览:90