当前位置:首页 » 文件管理 » 有损压缩编码的是

有损压缩编码的是

发布时间: 2023-05-15 03:32:04

㈠ .mp3是不是有损压缩的格式

是的
MP3全称为MPEG Audio Layer-3。是一种压缩格式标准。

CD转换为MP3后,原表现出来的频率是不是“丢失”了呢?
是的。MP3压缩并不是对所有频率进行量化处理,而是去掉那些人类听觉系统所无法察觉的声音,以达到压缩的目的。因此MP3是一种有损的音频压缩编码。无论多么高码率的mp3它都是有损压缩,声音的品质是比CD下降了的。

为什么普通人类听MP3仍觉得效果不错呢?
人类能听到的声音频率范围(音频)是20Hz~20kHz,但人耳对整个音频频段声音的反应不是平直的,2~5kHz是人耳最灵敏的频段。依其特性将整模盯个音频频段分成多个临界频带,因为人类听觉系统是依据频率来分辨声音能量的,任何频率的细小声音都会因掩蔽效应而被临界频带内音量较高的声毕码隐音所覆盖。

要是把MP3再刻录成CD还会有原音乐公司出来的好吗?
不会。手厅

㈡ 常用压缩编码格式

WAV编码的一种实现方式(其实它有非常多实现方式,但都是不会进行压碧昌缩操悔烂扒作).就是在源PCM数据格式的前面加上44个字节.分别用来描述PCM的采样率,声道数,数据格式等信息.

特点:音质非常好,大量软件历搭都支持其播放
适合场合:多媒体开发的中间文件,保存音乐和音效素材

MP3编码具有不错的压缩比,而且听感也接近于WAV文件,当然在不同的环境下,应该调整合适的参数来达到更好的效果.

特点:音质在128Kbit/s以上表现不错,压缩比比较高.大量软件和硬件都支持.兼容性高.
适合场合:高比特率下对兼容性有要求的音乐欣赏.

AAC是目前比较热门的有损压缩编码技术,并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三种主要编码格式.

LC-AAC 是比较传统的AAC,主要应用于中高码率的场景编码(>= 80Kbit/s)

HE-AAC 主要应用于低码率场景的编码(<= 48Kbit/s)

特点:在小于128Kbit/s的码率下表现优异,并且多用于视频中的音频编码

适合场景:于128Kbit/s以下的音频编码,多用于视频中的音频轨的编码

Ogg编码是一种非常有潜力的编码,在各种码率下都有比较优秀的表现.尤其在低码率场景下.Ogg除了音质好之外,Ogg的编码算法也是非常出色.可以用更小的码率达到更好的音质.128Kbit/s的Ogg比192Kbit/s甚至更高码率的MP3更优质.但目前由软件还是硬件支持问题,都没法达到与MP3的使用广度.

特点:可以用比MP3更小的码率实现比MP3更好的音质,高中低码率下均有良好的表现,兼容不够好,流媒体特性不支持.
适合场景:语言聊天的音频消息场景

㈢ 视频编解码技术的有损压缩

典型的有损压缩编码技术介绍如下。
1、预测编码:点线性预测、帧内预测、帧间预测。
预测编码主要是减少数据在空间和时间上的相关性,以达到对数据压缩的目的。
2、变换编码:KL(Karhunen-Loeve变换)、DFT(Discrete Fourier Transform,离散傅里叶变换)、DCT(Discrete Cosine Transform,离散余弦变换)、DST(Discrete Sine Transform,离散正弦变换)、HADAMARD(哈达码变换)、小波变换。
变换编码将图像时域信号变换到频域上进行处理。
3、量化编码:标量量化、矢量量化。
当我们对模拟信号进行数字化时,需要经历一个量化的过程。在这里,量化器的设计是一个很关键的步骤,量化器设计的好坏对于量化误差的大小有直接的影响。矢量量化是相对于标量量化而提出的,如果一次量化多个点,则称为矢量量化。
4、子带编码:子带编码、块切割法。
子带编码主要有两种方式。一种是,将图像数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。另外一种是,分步渐进编码,在初始时对某一频带的信号进行解码,然后逐渐扩展到所有频带,随着解码数据的增加,解码图像也逐渐的清晰起来。子带编码对于远程图像模糊查询与检索的应用比较有效。
5、模型编码:结构模型、知识基模型。
结构模型编码,也称为二代编码。编码时首先求出图像中的边界、轮廓、纹理等结构特征参数,然后保存这些参数信息。解码时根据结构和参数信息进行组合,从而恢复出原图像。
知识基模型编码,对于人脸等可用规则描述的图像,利用人们对其的知识形成一个规则库,据此将人脸的变化等特征用一些参数进行描述,从而根据参数和模型就可以实现对人脸的图像编解码。
6、混合编码:JPEG、H.261、MPEG等。
混合编码同时使用两种或两种以上的编码方法进行编码。

㈣ 图像压缩编码方法有哪几类

总的来说可以分为:有损编码、无损编码或者分为变换编码、统计编码。
有损编码
有损编码又称为不可逆编码,是指对图像进行有损压缩,致使解码重新构造的图像与原始图像存在一定的失真,即丢失了了部分信息。由于允许一定的失真,这类方法能够达到较高的压缩比。有损压缩多用于数字电视、静止图像通信等领域。
无损编码
无损压缩又称可逆编码,是指解压后的还原图像与原始图像完全相同,没有任何信息的损失。这类方法能够获得较高的图像质量,但所能达到的压缩比不高,常用于工业检测、医学图像、存档图像等领域的图像压缩中[15]。
预测编码
预测编码是利用图像信号在局部空间和时间范围内的高度相关性,以已经传出的近邻像素值作为参考,预测当前像素值,然后量化、编码预测误差。预测编码广泛应用于运动图像、视频编码如数字电视、视频电话中[ ]。
变换编码
变换编码是将空域中描述的图像数据经过某种正交变换(如离散傅里叶变换DFT、离散余弦变换DCT、离散小波变换DWT等)转换到另一个变换域(频率域)中进行描述,变换后的结果是一批变换系数,然后对这些变换系数进行编码处理,从而达到压缩图像数据的目的。
统计编码
统计编码也称为熵编码,它是一类根据信息熵原理进行的信息保持型变字长编码。编码时对出现概率高的事件(被编码的符号)用短码表示,对出现概率低的事件用长码表示。在目前图像编码国际标准中,常见的熵编码方法有哈夫曼(Huffman)编码和算术编码。

㈤ 有损压缩的常见格式

——MP3(MP3PROMP3SURROUND)、AAC(*.3gp/*.mp4/*.m4a)、ATRAC3/ATRAC3+(*.aa3)。
先来明白音频压缩的原理:利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性等)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时凡是人耳感觉不到的频率不编码、不传送,即凡是对人耳辨别声音信号的强度、声调、方位没有贡献的部分(称为不相关部分或无关部分)都不编码和传送。对感觉不到的部分进行编码时,允许有较大的量化失真、并使其处于听阈(即人耳所能听到的最低音量)以下,人耳仍然感觉不到。音频的压缩就是利用这些特点来工作的。 1、等响度曲线
人的听觉的灵敏度随着频率而改变。即通常两个功率一样但频率不同的音调听起来并不一样响。通过等响度曲线,我们可以看出,人耳对4KHz的频率最灵敏,即在4KHz下能被察觉出来的声音压力水平(响度),在其他频率下并不能被察觉。这就给在一些不太灵敏的频率下失真提供了条件。
2、屏蔽
我们上高中物理时学过屏蔽。就是强的声音信号把弱的声音信号覆盖,导致我们无法察觉。而且,当两个声音在时间和频率上很接近时,屏蔽效应就会很强。因此,我们可以在编码时对被屏蔽的部分不编码、不传送。这样,音质依然没有大的损失,人耳也不易察觉。
3、临界频带
对于人类的听觉来说,对声音的感知特性并不是以线形频率为尺度来变化的(人的听觉还没那么好),而是可以用被称为临界频带的一系列有限的频段来表达。简单的说,把整个频带划分成几段,在这每个频段里,人耳的听觉感知是相同的,即心理声学特性都是一样的。
言归正传,编码的精髓就是算法。 1、MP3(MP3PROMP3SURROUND)
MP3应该算目前应用最广泛的有损压缩数字音频格式了。它的全称是MPEG(MovingPictureExpertsGroup)AudioLayer-3。1987年德国Fraunhofer研究院研制成功的一种有损压缩数字音频格式,并于1989年取得专利。起初,它并不完善,它更像一个编码标准框架,留待人们去完善。1992年,这一技术并入了MPEG规范,并有了正式名号——MP3。
MP3文件是由帧(frame)构成的,帧是MP3文件最小的组成单位。什么是帧?还记得最初的动画是怎么做的吗?不同的连续画面切换以达到动态效果,每幅画面就是一个“帧”,不同的是MP3里面的帧记录的是音频数据而不是图形数据。MP3的帧速度大概是30帧/秒。
每个帧又由帧头和帧数据组成,帧头记录着该帧的基本信息,包括位率索引和采样率索引(这对理解ABR和VBR编码方式很重要)。帧数据,顾名思义就是记录着主体音频数据。
上面说的都是MP3编码的基础,但事实上,早期的编码器都非常不完善,压缩算法近于粗暴,音质很不理想。MP3的音质有两次飞跃:人体听觉心理学模型(PerceptualModel)的导入和VBR技术的应用。
PS:VBR是variablebitrate的缩写,意思是可变比率,就是MP3文件压制的时候声音元素较多,比率较高时,将自动减低压缩比特率,在比特率需求比较低时自动升高比特率,这样做的目的是在保证音质基本不被损害的情况下增加文件在线播放时的速度,和减少在本机播放时所占的系统资源……这是Xing发展的算法,他们将一首歌的复杂部分用高Bitrate编码,简单部分用低Bitrate编码。主意虽然不错,可惜Xing编码器的VBR算法很差,音质与CBR相去甚远。幸运的是,Lame完美地优化了VBR算法,使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式,推荐编码模式。
MP3能生存到今天,它的发展仍未止步。2001年6月14日,法国汤姆森与美国RCA两家公司联合推出了一种新的压缩格式:MP3PRO。MP3PRO是基于MP3技术改良而来,它利用了CodingTechnologies公司开发的编解码增强技术,该术称为SBR(SpectralBandReplication)。当制作MP3PRO文件时,编码器将音频分为两部分。一部分是将音频数据中的低频部分分离出来,通过传统的MP3技术编码得出正常的MP3音频流。此举使MP3编码器专注于低频段信号的压缩从而获得更好的质量,而且使原来的MP3播放器也能播放MP3PRO文件。另一部分则是将分离出来的高频信号进行编码并嵌入MP3流中。传统的MP3播放器会将其忽略掉,而新的MP3PRO播放器会将其还原出来并进行组合,得到高质量的全带宽的声音。通过这项技术,使得MP3PRO64Kbps的编码率便可提供128Kbps的MP3相同的质量,且具有相差无几的音质,而体积只有MP3的一半大小。
PSP就支持MP3PRO,而且支持MP3PRO的格式转换软件也很多,大家可以去网上找找。有兴趣的话可以试试,绝对比mp3强啊。
Thomson在2004年12月初正式宣布世界上最流行的音乐压缩格式MP3迈进多声道时代。MP3SURROUND是由FraunhoferIIS和Agere联合开发的,使用了binauralCueCoding(BCC)技术心理声学编码,可以在实现多声道环绕的同时保证文件的大小。同时加入的AgereSystems公司则主要负责将多声道MP3格式——MP3SURROUND进行推广。MP3SURROUND技术实现了5.1声道环绕的高品质音频,应用范围相当广泛,可以在网络音乐发布、广播系统、PC视听应用、游戏音效、消费电子产品和车载音响等方面发挥作用。尽管集成了多个声道,但是Thomson表示MP3SURROUND文件相对于普通MP3(采样率相当)并没有太大的增加,相对于其他环绕多声道音频格式就只有它们的一半了。更为重要的,MP3SURROUND提供了良好的兼容性,可以在现有的MP3软件、MP3播放器上正常使用。
2、AAC(*.3gp/*.mp4/*.m4a)
AAC是高级音频编码(AdvancedAudioCoding)的缩写,它是由Fraunhofer研究院、杜比和AT&T共同研发的。AAC是MPEG-2规范的一部分,它适用于从速率8Kbps的单声道电话音质到160Kbps多声道的超高质量音频范围内的编码。AAC与MP3相比,增加了诸如对立体声的完美再现、码流效果音扫描、多媒体控制、降噪优化等MP3音频格式所没有的特性,使得在音频压缩后仍能完美地再现CD音质。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容性、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
现将其中的几个模块作一些说明:
增益控制(Gaincontrol)
增益控制模块用在可变采样率配置中,它由多相正交滤波器PQF(polyphasequadraturefilter)、增益检测器(gaindetector)和增益修正器(gainmodifier)组成。这个模块把输入信号分离到4个相等带宽的频带中。在解码器中也有增益控制模块,通过忽略PQF的高子带信号获得低采样率输出信号。
滤波器组(FilterBank)
滤波器组是把输入信号从时域变换到频域的转换模块,它是MPEG-2AAC系统的基本模块。这个模块采用了改进离散余弦变换MDCT,它是一种线性正交交迭变换,使用了一种称为时域混迭取消TDAC()技术。MDCT使用KBD(Kaiser-Besselderived)窗口或者使用正弦(sine)窗口,正向MDCT变换可使用下式表示:
逆向MDCT变换可使用下式表示:
其中,
n=样本号,
N=变换块长度,
i=块号,
以上两个离散余弦变换公式在《离散函数》和《数理方程》中有详细介绍,只为帮助有兴趣的玩家了解,不必深究。
瞬时噪声定形TNS
在感知声音编码中,TNS模块是用来控制量化噪声的瞬时形状的一种方法,解决掩蔽阈值和量化噪声的错误匹配问题。这种技术的基本想法是,在时域中的音调声信号在频域中有一个瞬时尖峰,TNS使用这种双重性来扩展已知的预测编码技术,把量化噪声置于实际的信号之下以避免错误匹配。
联合立体声编码
联合立体声编码(jointstereocoding)是一种空间编码技术,其目的是为了去掉空间的冗余信息。MPEG-2AAC系统包含两种空间编码技术:M/S编码(Mid/Sideencoding)和声强/耦合(Intensity/Coupling)。M/S编码使用矩阵运算,因此把M/S编码称为矩阵立体声编码(matrixedstereocoding)。M/S编码不传送左右声道信号,而是使用标称化的“和”信号与“差”信号,前者用于中央M(middle)声道,后者用于边S(side)声道,因此M/S编码也叫做“和-差编码(sum-differencecoding)”。声强/耦合编码的名称也很多,有的叫做声强立体声编码(intensitystereocoding),或者叫做声道耦合编码(channelcouplingcoding),它们探索的基本问题是声道间的不相关性(irrelevance)。
预测(Prediction)
这是在话音编码系统中普遍使用的一种技术,它主要用来减少平稳(stationary)信号的冗余度。
量化器(Quantizer)
使用了非均匀量化器。
无噪声编码(Noiselesscoding)
无噪声编码实际上就是霍夫曼编码,它对被量化的谱系数、比例因子和方向信息进行编码。
PS:我个人比较喜欢AAC,所以写的较为详细,大家也不妨试试,绝对比MP3优秀。大家可以使用iTunes6来转换AAC(*.m4a)。iTunes6AAC的操作很简单,你可以直接把AAC(*.3gp*.mp4*.m4a)拷贝到[MUSIC]就能播。
可以说,aac是目前最好的有损压缩方式。
最高质量的普较无损看(肉眼)不出区别。
3、ATRAC3/ATRAC3+(*.aa3)
早年玩MD的朋友都知道SONY专为MD量身定做的ATRAC音频格式算法,后来又广泛应用于SONY的NetworkWalkman和其他便携音频设备。“ATRAC3plus”代表“自适应转换声音编码3+”,是一套基于心理声学原理的音频压缩技术,从ATRAC3格式发展而来,到2002年这项技术才日趋完美。这一技术是把MD随身听的体积缩小到很小的理论基础。
要分析ATRAC3/ATRAC3+,我们先要谈谈它的大哥——ATRAC算法。当数字音频数据被压缩时,通常都会把一定数量的量化噪音带入信号。为了不让这些信号被人耳感知,通常的做法是,音频编码把信号分解为一组单元,每组单元都对应着特定的时间频率范围。编码器会依据前文提到的心理声学原理来分析,对重要的单元进行高精度编码,对不敏感的单元可以保留一些量化的噪音但不影响人耳的感知质量。解码时,量化频谱会根据比特分配重新建立,然后合成音频信号。
ATRAC也不例外,但有一些改进。ATRAC还应用了子频带译码和转换译码技术,输入的信号被分配得到不均匀的强调重要低音区的频率分割。另外,ATRAC使用一个可变块长度改变输入的信号,这可以确保在稳定通过时高效的译码,不会在瞬间通过时影响时间的分辨率。具体说,输入的信号在5.5125KHz和11.025KHz被分为3个频带。子频带的分解使用QMF(QuadratureMirrorFilters积分映射过滤器)来完成;这3个频带被MDCT(变址离散余弦变换——类似于通常的快速傅里叶变换,《高等数学二》和《数理方程》中有相关介绍。)转换成频谱值,MDCT允许块之间有达50%的交迭,使得在维持临界采样时能提高频率分辨率。块的长度可以根据信号的种类改变,这就是ATRAC的自适应部分(这一做法主要是为了利用屏蔽掩盖初始量化噪音)。
当ATRAC算法发展了10年,已经满足不了市场的需求,SONY于2002年8月推出了新的算法——
ATRAC3/ATRAC3+。其核心算法较ATRAC没有本质的大改变,只是采用了改进的频带分离过滤和MDCT,并使用增益调节、音调成分分离、联合立体声(Joint-Stereo)等技术,使得音频压缩数据的体积进一步缩小。
4、AAL(ATRACAdvancedLossless)
AAL是ATRACAdvancedLossless(自适应声学转换高级无损编码)的缩写,是SONY新开发的一个音频压缩格式其特点是无损压缩,不损失一点音频信息,一张CD可以压缩到原来的30%--80%。
5、Ogg
Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。
Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。
Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的。创建的OGG文件可以在任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。
较aac而言,低频方面略有优势,高频方面比aac差。
最高质量的普较无损看(肉眼)不出区别。
最高质量,即Q10,体积比aac使用faac编码最高质量Q500体积大差不多一倍。
编码开源。

㈥ WAV是无损压缩编码,而MP3,WMA是有损压缩编码

wav是无损音频格式;
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数卖扮孝,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
WMA,它是微软公司推出的缺拍与MP3格式齐名的一种新的音频格式。WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生中稿较好的音质。

㈦ 有损压缩算法

基本的分为两大类:有损和无损。
有损压缩:主要是一些量化算法,比如a率,u率,lloyds最优量化。
无损压缩:主要是一些编码算法,比如子带编码,差分编码,哈夫曼编码等。
另外时频变换虽然没压缩效果,但是是很好的压缩工具,比如fft,dct等。
最后就是压缩感知稀疏重建等。
由于信息丢失意味着在误差和比特率之间进行一些权衡,我们首先考虑失真度量---例如,平方误差。本文引入了不同的量化器,每个量化器都具有不同的失真行为。许多有损数据压缩算法开发的数学基础是随机过程的研究。

介绍:

当图像直方图相对平坦时,使用无损压缩技术(例如,霍夫曼编码,算术编码,LZW)的图像数据的压缩比较低。对于需要更高压缩比的多媒体应用中的图像压缩,通常采用有损方法。在有损压缩中,压缩图像通常与原始图像不同,但在感知上与原始图像近似。为了定量描述近似值与原始数据的接近程度,需要某种形式的失真度量。

失真测量:

失真度量是一种数学量,它使用一些失真标准指定近似值与其原始值的接近程度。在查看压缩数据时,很自然地会根据原始数据和重建数据之间的数值差异来考虑失真。 然而,当要压缩的数据是图像时,这样的度量可能不会产生预期的结果。

例如,如果重建的图像与原始图像相同,只是它被向右移动一条垂直扫描线,那么普通的人类观察者将难以将其与原始图像区分开,因此可以得出结论:失真很小。 然而,当以数字方式执行计算时,由于重建图像的各个像素的大的变化,我们发现大的失真。问题是我们需要一种感知失真的测量,而不是一种更天真的数值方法。然而,对感知扭曲的研究超出了本书的范围。

在已经定义的许多数值失真度量中,我们提出了图像压缩中最常用的三种。如果我们对平均像素差异感兴趣,则经常使用均方误差(MSE)。 它被定义为

㈧ 典型的有损压缩编码方法错误的是

错误的是:啥夫曼编码将出现概率大的信源符号用长码表示,出现概率小的信源符号用短码表示。
对于多媒体数据,按照压缩的原理可分为熵编码、源编码和混合编码。其中,源编码包含预测编码去、变换编码法和矢量量化编码法,属于有损压缩编码,如表210所示。啥夫曼编码是最着名的熵编码,它将出现概率大的信源符号用短码表示,而出现概率小的信源符号用长码表示,于是平均码长接近信息熵的理论值。因此这个是错误的。

热点内容
存储空间不足但 发布:2025-02-12 04:46:27 浏览:273
树莓派编程板 发布:2025-02-12 04:41:45 浏览:904
php取整 发布:2025-02-12 04:33:21 浏览:221
我的世界创造服务器位置 发布:2025-02-12 04:24:49 浏览:701
毛利润算法 发布:2025-02-12 04:22:42 浏览:754
战舰少女r红茶脚本 发布:2025-02-12 04:05:05 浏览:465
峰火战国服务器什么时候开 发布:2025-02-12 03:56:31 浏览:175
电脑配置慢怎么解压 发布:2025-02-12 03:52:18 浏览:716
androidsdk功能 发布:2025-02-12 03:43:07 浏览:87
阿里云服务器可以访问外网吗 发布:2025-02-12 03:42:20 浏览:880