音频存储环节
A. 声音文件是怎么存储的呢
存储在计算机里的都是以二进制形式存在的,但是音频是波形的。所以要存到电脑里的话首先要解决的就是如何表示的问题,也是就是编码。然后要通过介质播放出来,这就是解码。一般的格式都有这些编码和解码功能的。CD也是以二进制形式存储的。 常见的有WAV,MP3,WMA,OGG,APE,AAC等。他们一般在编码的基础上对音频进行了压缩,解码的同时还要进行解压。
B. 怎么把手机里的音频存到U盘上
无需依赖电脑,通过 USB OTG 数据线即可连接U 盘。
温馨提醒:
此功能仅适用于支持 USB OTG 数据线的手机。
如果手机采用 Type-C 接口,请购买华为认可的 Micro USB 转 Type-C 接头,或者带 Type-C 接口的 USB OTG 数据线。
以华为P50 Pro手机为例:
1.通过 USB OTG 数据线将手机和 U 盘连接。
2.打开文件管理 > 浏览 > U 盘,浏览 U 盘的数据,选择需要复制的数据,拷贝到目标文件夹。
温馨提醒:使用该功能前,请提前备份好数据(微信、QQ等第三方应用需单独备份)将您的设备升级到最新版本。
3.拷贝完毕,点击设置 > 存储 > U 盘 > 弹出。
C. 音频在计算机中的存储不经过哪个过程
音频表示声音或者音乐。它和文字数字等不同,它是随时间变化的。但是计算机并没有无限数量的内存单元,音频在计算机中的存储要经过采样量化编码等过程。
1.采样我们不能记录一段时间内的所有一频信号,但是可以记录其中的一些。采样就是我们在模拟信号上选择数量有限的点来度量它们的值并记录下来。采样率是指每秒钟需要多少个样本。通常来说每秒40000个样本的采样率对音频信号是足够好的。
2.量化从每个样本得到的是真实的数字,但是为没一个样本使用一个二进制无符号数会更简便。量化是指将样本的值截取为最接近的整数值。如果实际值为。7.2则截取为7实际的值为。
7.8则截取为83.编码编码是把量化的样本值编码成二进制形式。每样本位:也称位深度。是指对于每个样本分配多少位。以前是8位,现在大多是16、24、32位位率:位深度乘以每秒样本数就是位率。如果每秒40000个样本每样本16位则位率为40000*16=640000b/s=640KB/s。
4.声音编码标准现在主流的mp3标准。采用每秒44100个样本以及每样本16位,位率为705600b/s。这是一种有损压缩。
D. 电脑声音是怎么储存的
声音是通过声音的编码储存的。主要介绍波形编码中的脉冲编码调制。PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
采样:一次振动中,必须有2个点的采样,关于为什么有2个点采样,我在视频课程中已经介绍了,这里不再赘述。人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。
量化:每个声音样本若用8位存储,样本只能存储0-255个信息,每个声音样本若用16位存储,则可以存储0-65535个信息,说明量化精度越高,声音质量越好。
编码:量化后的抽样信号十进制数字信号,应将十进制数字代码变换成二进制编码。
常用的采样率:
8kHz 为电话采样。
11.025kHz能达到AM调幅广播的声音品质。
22.05kHz FM调频广播所用采样率。
44.1kHz 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率。
48kHz miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
(4)音频存储环节扩展阅读
声音数字化过程:
比如用麦克风录了一段10秒钟的声音。声音的波形,它是一段光滑的曲线,而计算机就是要尽可能的把这个光滑的曲线在电脑上模拟出来。所以第一步就是,对这曲线进行采样,比如计算机每秒对这个曲线采样1次,采样之后,计算机就把这个10秒的声音在电脑上模拟出来了。
但这时候我们发现,模拟出来的波形和左边原始真实的波形相差很大,可以提高计算机的采样频率,从每秒1次变成每秒钟采样2次,采样的频率越高,计算机模拟出来的曲线就越接近于原始声音的曲线,也就越能还原出原始的声音。
然后第二步,就是把刚才模拟出来的声音进行量化,量化的意思就是比如考试成绩有51、60、65、23、95、78这样的分数,但在公布成绩的时候,学校发现分数太多,一个一个的公布太麻烦,然后学校规定,60分以下不合格,60-70分之间为合格,71-100为优秀。
把这些不同的分数分成3个不同的等级,之后学校公布成绩的时候就说,我校本年度成绩不合格人数3人,成绩合格人数100人,成绩优秀人数500人,这个就是量化。
完成了量化之后就是最后一步,进行编码。假设量化等级一级(比如不合格这个等级)等于0001,二级(合格这个等级)等于0011,然后以此类推,依次把这些等级记录成对应的一串0和1就可以了。到这里计算机就完成了把声音数字化的过程。
E. 怎样对声音素材进行删除.合并,复制处理
第5章 音频素材制作与处理
本章主要学习音频相关的基础知识,包括模拟音频与数字音频的概念和各自的特点;数字音频所具有的优势;模拟音频转换为数字音频的过程和技术指标;常用的数字音频文件格式;语音合成技术与识别技术的基本原理。本章需要在实验环节掌握Adobe Audition 2.0音频处理软件的基本操作,主要包括录音、编辑和效果处理三个方面。
& 学习指导
1、模拟音频 声音是振动的波,是随时间连续变化的物理量。因此,自然界的声音信号是连续的模拟信号,即模拟音频信号。
声波与普通波形一样,可以用三个物理量来描述:振幅、周期和频率。
(1)振幅:振幅是声音波形振动的幅度,表示声音的强弱。
(2)周期:周期是声音波形完成一次全振动的时间。
(3)频率:频率是声音波形在一秒钟内完成全振动的次数,表示声音的音调。
声音具有三个要素:音调、音色和音强。
(1)音调:音调代表声音的高低。与频率有关,频率越高,音调越高。
(2)音色:音色是声音的特色。声音分纯音和复音两种类型。纯音的振幅和周期均为常数;复音是具有不同频率和不同振幅的混合声音,是影响声音特色的主要因素。自然界的大部分声音是复音。在复音中,频率最低的声音是“基音”,是声音的基调。其他频率的声音是“谐音”。基音和谐音是构成声音音色的重要因素。人的声音、其它生物的声音以及自然界各种声响都具有自己独特的音色。人们往往是依据音色来辨别声源种类的。
(3)音强:音强是声音的强度。音强与声波的振幅成正比,振幅越大,音强越大。
2、模拟音频的特点
(1)频率范围:模拟音频信号由许多频率不同的信号组成,每个信号都有各自的频率范围,称为“频域”或“频带”。人耳可听到的声音频率在20Hz-20KHz之间,称为“可听域”。频率高于20KHz的声音信号称为“超音频信号”,频率低于20Hz的声音信号称为“亚音信号”或者“次音信号”。多媒体技术所处理的声音信号主要是20Hz-20KHz的音频信号,它包括音乐、语音及自然界的各种声响。另外,不同种类的声源频带是不同的,例如人类语音频带在100Hz -10KHz;高级音响设备频带在20Hz-20KHz;而宽带音响设备的频带在10Hz-40KHz。总之,频带越宽声音的表现力越好。
(2)模拟音频具有连续性。
(3)模拟音频抗干扰能力差:模拟信号的一个重要的缺点就是噪声容限较低,抗干扰能力差,噪声是影响模拟音频录音质量的重要原因。音频信号幅度与噪声幅度的比值越大越好。音响放大器和扬声器等还原设备的质量能够直接影响重放的音质。音质与音色和频率范围有关。悦耳的音色、宽广的频率范围,能够获得更好的音质。
3、数字音频 数字音频是以二进制的方式记录的音频,是模拟音频的数字化表达。
4、数字音频的优势 相比模拟音频信号,数字音频信号具有很多优势。
(1)在声音存储方面。模拟音频记录在磁带或者唱片等模拟介质中。模拟介质难保存、易老化,造成音质下降。同时,磁带的存储效率很低,音频录制往往需要大量的磁带介质进行存储,成本很高。数字音频可以文件的形式存储在光存储介质或磁存储介质中,可以实现永久保存,并且存储成低。
(2)在声音处理方面。模拟音频录制难度高,需要尽量做到一次成功,后期处理难度大。数字音频技术在声音处理方面具有极大的优势,在后期的音频处理过程中,可以非常容易地进行多种修正以及加工。
(3)在声音的压缩方面。模拟音频的压缩率很难提高。数字音频的压缩优势明显。例如目前流行的MP3音频格式,压缩率达到10%左右的同时还能保持良好的音质,利于在互联网上传播。
5、模拟音频/数字音频转换 模拟音频信号转换为数字音频信号的过程就是对于模拟音频信号的数字化过程。模拟音频信号的数字化过程与普通模拟信号数字化过程类似,需要三个步骤:采样、量化和编码。
(1)采样:采样就是每隔一定的时间间隔T,抽取模拟音频信号的一个瞬时幅度值样本,实现对模拟音频信号在时间上的离散化处理。
(2)量化:量化就是将采样后的声音幅度划分成为多个幅度区间,将落入同一区间的采样样本量化为同一个值。量化实现了对模拟信号在幅度上的离散化处理。
(3)编码:编码就是将采样和量化之后的音频信号转换为“1”和“0”代表的数字信号。
6、模/数转换质量的技术指标 影响模/数转换后的数字音频信号质量的技术指标主要包括采样频率、采样精度、声道数和编码算法。
(1)采样频率。采样频率是对声音波形每秒钟进采样的次数。奈奎斯特理论指出:采样频率不应低于模拟音频信号最高频率的两倍,这样才能将数字化的声音还原为原始声音。采样频率越高,声音失真越小,音频数据量越大。
(2)采样精度。采样精度表示对声音振幅的量化精度,即将声音波形的幅度划分为多少个幅度区间。8位量化表示,将声音波形的幅度划分为28个区间。
(3)声道数。声道数表示同一时间产生的声音波形数。如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声。立体声表达的声音效果丰富,但存储空间会增加一倍。
(4)编码算法。编码算法的作用一方面是采用一定的格式来记录数据,二是采用一定的算法来压缩数据。压缩比是压缩编码的基本指标,表示压缩的程度,是压缩后的音频数据量与压缩前的音频数据量的比值。压缩程度越大,信息丢失越多、信号还原后失真越大。根据不同的应用,应该选用不同的压缩编码算法。
7、数字音频的存储空间 模拟音频数字化过程中的采样频率和采样精度越高,结果越接近原始声音,但记录数字声音所需存储空间也随之增加。未经压缩的音频文件所需的存储空间的计算公式如下:
存储容量(字节)=(采样频率×采样精度)/8×声道数×时间
8、数字音频文件格式 数字化音频以文件的形式存储在计算机内。由于音频数字化过程中采用的技术指标不同,产生了不同的音频文件格式。常见的数字音频格式如下:
(1)WAV格式。微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式。
(2)MIDI格式。也称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。MIDI文件中存储的是一些指令,由声卡按照指令将声音合成出来。
(3)CDA格式。CDA格式是CD音乐格式,取样频率为44.1kHz,16位量化位数,CDA格式记录的是波形流,是一种近似无损的格式。
(4)MP3格式。MP3格式是MPEG-1 Audio Layer 3,能够以高音质、低采样率对数字音频文件进行压缩。
(5)WMA格式。是微软公司开发的网络音频格式。
(6)MP4格式。采用了“知觉编码”压缩技术,加入了保护版权的编码技术。MP4的压缩比高于MP3,但音质却没有下降。
(7)QuickTime格式。苹果公司推出的一种数字流媒体。
(8)RealAudio格式。Real Networks公司推出的一种文件格式,可以实时传输音频信息。RealAudio文件格式主要有RA、RM、RMX三种,能够随着网络带宽的不同而调整声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽的听众获得更好的音质。
(9)VOC格式。常用在DOS程序和游戏中,是随声卡一起产生的数字声音文件。
(10)AU 格式。应用于互联网上的多媒体声音,是UNIX操作系统下的数字声音文件。
(11)MAC格式。苹果公司开发的声音文件格式,广泛应用与Macintosh平台软件。
(12)AAC格式。是MPEG-2规范的一部分。压缩能力强、压缩质量高。可以在比MP3文件缩小30%的前提下提供更好的音质。
9、语音合成 语音合成是指利用计算机合成语音的一种技术,使计算机能够产生高清晰度、高自然度的连续语音,具有类似于人一样的说话的能力。
语音合成可以通过将预先录制并存储的语音信号重新播放来实现。也可以采用数字信号处理的方法,通过激励一个类似人们发声时声道谐振特性的时变数字滤波器,调整滤波器的相关参数,生成各种音调的语音。
语音合成可分为三个层次,分别是文字到语音、概念到语音、意向到语音。要合成出高质量的语言,必须遵循人类语言的表达规则,如语义学规则、词汇规则、语音学规则。
10、语音合成技术分类 按照合成方法分类。分为参数合成法、基音同步叠加法和基于数据库的语音合成法。
(1)参数合成法。通过调整合成器参数实现语音合成。
(2)基音同步叠加法。通过对时域波形拼接实现语音合成。
(3)基于数据库的语音合成法。采用预先录制语音单元并保存在数据库中,再从数据库中选择并拼接出各种语音内容。
按照技术方式分类。分为波形编辑合成、参数分析合成以及规则合成。
(1)波形编辑合成。将语句、短语、词或音节作为合成单元。这些单元被分别录音后进行压缩编码,组成一个语音库。重放时,取出相应单元的波形数据,串接或编辑在一起,经解码还原出语音。这种合成方式也称为录音编辑合成。
(2)参数分析合成。以音节、半音节或音素为合成单元。按照语音理论,对所有合成单元的语音进行分析,提取有关语音参数,这些参数经编码后组成一个合成语音库;输出时,根据待合成的语音的信息,从语音库中取出相应的合成参数,经编辑和连接,顺序送入语音合成器。在合成器中,通过合成参数的控制,将语音波形重新还原出来。
(3)规则合成。规则合成存储的是较小的语音单位,如音素、双音素、半音节或音节的声学参数,以及由音素组成音节、再由音节组成词或句子的各种规则。当输入字母符号时,合成系统利用规则自动地将它们转换成连续的语音波形。
11、文语转换系统 文语转换系统是语音合成的第一个层次,是将文字内容转换为语音输出的语音合成系统。
12、语音合成技术的需求和特点 语音合成技术具有四个方面的需求和特点:自然度、清晰度、表现力和复杂度。
13、语音识别 语音识别技术是让计算机通过识别和理解,将语音转变为文本或命令的技术,让计算机能够听懂人类的语言。
14、语音识别系统分类 语音识别系统按照其构成与规模有多种不同的分类标准。根据对说话人说话方式的要求,可以分为孤立字语音识别系统,连接字语音识别系统以及连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。
15、语音识别的关键技术 语音识别技术主要包括特征提取技术、模式匹配技术及模型训练技术。此外,还涉及到语音识别单元的选取。语音识别单元有单词、音节和音素三种。
(1)特征提取技术。在丰富的语音信号中提取出对语音识别有用的信息,通过对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。
(2)模型训练技术。按照一定准则,从已知模式中获取表征该模式本质特征的模型参数。
(3)模式匹配技术。根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
16、音频处理软件Adobe Audition 该软件是集音频的录制、混合、编辑和控制于一身的音频处理工具软件。可以轻松创建音乐、制作广播短片、修复录制缺陷。基本功能包括以下方面:
(1)录音。
(2)混音。将不同音轨中的声音混合在一起,综合输出经过混合的声音效果。
(3)声音编辑。例如声音的淡入淡出、声音移动和剪辑、音调调整、播放速度调整等。
(4)效果处理。软件带有不同类型的效果器,如压缩器、限制器、均衡器、合唱效果器、延迟效果器、回升效果器等,能够实时处理声音的效果。
(5)降噪:实现在不影响音质的情况下,去除噪声。
(6)声音压缩。软件具有支持目前几乎所有流行的音频文件类型,并能够实现类型的转换和文件压缩。
(7)协同创作。能够与多种音乐软件协同运行,实现音乐创作。
17、音频处理软件Adobe Audition基本操作 Adobe Audition 2.0 音频处理软件具有三种编辑模式界面,分别是多轨编辑模式、单轨编辑模式以及CD模式。多轨与单轨界面大致可以分为菜单栏、工具栏、文件/效果器列表栏、音轨显示区、基本功能区和电平显示区。
常用的音频编辑方法主要是对音频波形进行裁剪、切分、合并、锁定、编组、删除、复制以及对音频进行包络编辑和时间伸缩编辑。
音频特效处理主要使用各种效果器,主要包括均衡效果处理、混响效果处理、压限效果处理、延迟效果处理等。
& 习题解析
一、单选题
1.人耳可以听到的声音频率范围为 。
A)20-20kHz
B)200-15 kHz
C)50-20 kHz
D)10-20 kHz
答案:A
解析:人耳听到的声音频带范围是有限的,频率低于20Hz和高于20000Hz的声音信号人类听不到,即表示人耳的可听域在20-20000Hz之间。
2. 格式的数字音频是微软公司开发的网络音频格式。
A)WAV
B)WMA
C)MP3
D)RM
答案:B
解析:WMA格式是Windows Media Audio的缩写,是微软公司开发的网络音频格式。其压缩率一般可以达到1:18。
3.声音的三个要素中不包括 。
A)音调
B)音质
C)音色
D)音强
答案:B
解析:声音具有三个要素:音调、音色和音强。
4.描述模拟音频信号的三个物理量中, 表示声音的音调。
A)振幅
B)音色
C)频率
D)音强
答案:C
解析:自然界的声音信号是连续的模拟信号,可以用三个物理量来描述:振幅、周期、频率。其中,频率是声音波形在一秒钟内完成全振动的次数,表示声音的音调。
5.描述模拟音频信号的三个物理量中, 表示声音的强弱。
A)振幅
B)音色
C)频率
D)周期
答案:A
解析:自然界的声音信号是连续的模拟信号,可以用三个物理量来描述:振幅、周期、频率。其中,振幅是声音波形振动的幅度,表示声音的强弱。
6.人们主要依据声音的 特点来区分和辨别声源的种类。
A)振幅
B)音色
C)音强
D)音调
答案:B
解析:人的声音、其它生物的声音以及自然界各种声响都具有自己独特的音色。人们往往是依据音色来辨别声源种类的。
7.人类语音的频带宽度是 Hz。
A)200-3400
B)100-10000
C)20-20000
D)20-15000
答案:B
解析:人类语音的频带宽度为100Hz-10000Hz。
8.模拟音频的声音质量主要与音色和 有关。
A)声音强度
B)频率范围
C)声音音调
D)基音
答案:B
解析:模拟音频的声音质量简称“音质”,与音色和频率范围有关。悦耳的音色、宽广的频率范围,能够获得更好的音质。
9.将模拟声音信号转换为数字音频信号的数字化过程是 。
A)采样→编码→量化
B)编码→采样→量化
C)量化→编码→采样
D)采样→量化→编码
答案:D
解析:模拟音频信号的数字化过程与普通模拟信号数字化过程类似,需要三个步骤:采样、量化和编码。
10.将模拟音频信号在时间上进行离散化处理,这一过程叫 。
A)量化
B)编码
C)采样
D)压缩
答案:C
解析:要使模拟音频信号数字化,首先要在时间上对其进行离散化处理,这一过程叫采样。
11.以下数字音频文件格式中, 称为乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。
A)MP3
B)WAV
C)MIDI
D)QuickTime
答案:C
解析:MIDI格式是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。在MIDI文件中存储的是一些指令,把这些指令发送给声卡,由声卡按照指令将声音合成出来。
12.影响数字音频信号质量的主要技术指标是 。
A)采样频率和量化精度
B)压缩和解压缩
C)录音和播放
D)模拟和压缩
答案:A
解析:影响数字音频信号质量的主要技术指标主要包括采样频率、采样精度、声道数和编码算法。这些指标决定了数字化音频的质量。
13.奈奎斯特采样理论指出,采样频率不低于声音信号最高频率的 倍。
A)3
B)1/2
C)1/3
D)2
F. 小学信息技术音频文件的存储格式
1.WAV文件格式
WAV格式是音频文件中使用最广泛的未压缩格式之一。它的全称是Waveform Audio格式,在1991年由微软和IBM共同推出。音频容器使用未压缩技术,主要用于在CD中存储录音。
尽管目前这种格式在用户使用端不是很流行,但它仍然广泛运用于音频录制。因为WAV遵循标准的14位编码,并且采用未压缩技术,所以它的文件比较大。理想情况下,一分钟未压缩WAV文件的大小约为10 MB。不过,用户仍然可以选择使用无损压缩技术来压缩WAV文件。
2.AIFF文件格式
和WAV一样,AIFF文件也是未压缩的。AIFF文件格式基于IFF(可互换文件格式),最初由苹果公司推出,这也是苹果公司制造的设备主要支持该格式音频的原因。AIFF格式是在存储CD录音的WAV格式之前3年推出的。目前,苹果用户主要使用的AIFF-C格式就是AIFF格式的压缩版本。
3.PCM音频文件
PCM音频格式也是一种常用的未压缩格式,它主要用于把音频文件存储到CD和DVD中。PCM代表脉冲编码调制,是一种可以将模拟音频文件转换为数字格式的技术。为了达到理想情况,机器会以不同的间隔对音频文件进行采样,这就对应生成了文件的采样率。线性脉冲编码调制(LPCM)便是用于存储音频文件的PCM格式的子类型之一。
PCM、WAV与AIFF的差别
AIFF与WAV之间的实际差异并不突出,二者只是版权归属不同。WAV归微软所有,而AIFF归苹果所有。但二者的相同点是非常显着的,即这两种格式都需要依赖PCM技术将模拟声音转换为数字格式。也就是说,PCM是AIFF和WAV都包含的技术。而具体选择哪种格式主要取决于用户拥有的设备类型。
G. 声音文件是怎么存储的呢
摘要 存储在计算机里的都是以二进制形式存在的,但是音频是波形的。所以要存到电脑里的话首先要解决的就是如何表示的问题,也是就是编码。然后要通过介质播放出来,这就是解码。一般的格式都有这些编码和解码功能的。CD也是以二进制形式存储的。 常见的有WAV,MP3,WMA,OGG,APE,AAC等。他们一般在编码的基础上对音频进行了压缩,解码的同时还要进行解压。
H. 声音文件的存储格式及其区别
1. WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,跟CD一样,对存储空间需求太大不便于交流和传播。
2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。
3. 大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数,跟WAV一样,但CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。
4. MP3全称是MPEG-1 Audio Layer 3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。
5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。
6. WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
7. MP4采用的是美国电话电报公司(AT&T)所研发的以“知觉编码”为关键技术的a2b音乐压缩技术,由美国网络技术公司(GMO)及RIAA联合公布的一种新的音乐格式。MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。
8. SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富、清晰。
9. QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。现有版本为QuickTime 1.0、2.0、3.0、4.0和5.0,在5.0版本中还融合了支持最高A/V播放质量的播放器等多项新技术。
10. VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。
11. DVD Audio 是新一代的数字音频格式,与DVD Video尺寸以及容量相同,为音乐格式的DVD光盘,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合。低采样率的192kHz、176.4kHz虽然是2声道重播专用,但它最多可收录到6声道。而以2声道192kHz/24b或6声道96kHz/24b收录声音,可容纳74分钟以上的录音,动态范围达144dB,整体效果出类拔萃
12. Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一张小小的盘中存储60~80分钟采用44.1khz采样的立体声音乐,就是因为使用了ATRAC算法(自适应声学转换编码)压缩音源。这是一套基于心理声学原理的音响译码系统,它可以把CD唱片的音频压缩到原来数据量的大约1/5而声音质量没有明显的损失。ATRAC利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时将人耳感觉不到的成分不编码,不传送,这样就可以相应减少某些数据量的存储,从而既保证音质又达到缩小体积的目的。
13. RealAudio是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件格式主要有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质。
14. Liquid Audio是一家提供付费音乐下载的网站。它通过在音乐中采用自己独有的音频编码格式来提供对音乐的版权保护。Liquid Audio的音频格式就是所谓的LQT。如果想在PC中播放这种格式的音乐,你就必须使用Liquid Player和Real Jukebox其中的一种播放器。这些文件也不能够转换成MP3和WAV格式,因此这使得采用这种格式的音频文件无法被共享和刻录到CD中。如果非要把Liquid Audio文件刻录到CD中的话,就必须使用支持这种格式的刻录软件和CD刻录机。
15. Audible拥有四种不同的格式:Audible1、2、3、4。Audible.com网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种Audible.com 专用音频格式中的一种提供保护。每一种格式主要考虑音频源以及所使用的收听的设备。格式1、2和 3采用不同级别的语音压缩,而格式4采用更低的采样率和MP3相同的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进行下载。Audible 所采用的是他们自己的桌面播放工具,这就是Audible Manager,使用这种播放器就可以播放存放在PC或者是传输到便携式播放器上的Audible格式文件。
16.VOC文件,在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
17.AU文件,在Internet上的多媒体声音主要使用该种文件。AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。
18.AIFF(.AIF) 是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。
19. Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。
20.MAC声音(.snd) :Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。
21.S48(stereo、48kHz)采用MPEG-1 layer 1、MPEG-1 layer 2(简称Mp1,Mp2)声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。
22.AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
23.数字音频以音质优秀、传播无损耗、可进行多种编辑和转换而成为主流,并且应用于各个方面。
I. 音频,视频如何在计算机硬盘中存储原理是啥
声音是通过声音的编码储存的。主要介绍波形编码中的脉冲编码调制。PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
采样:一次振动中,必须有2个点的采样,关于为什么有2个点采样,我在视频课程中已经介绍了,这里不再赘述。人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。
量化:每个声音样本若用8位存储,样本只能存储0-255个信息,每个声音样本若用16位存储,则可以存储0-65535个信息,说明量化精度越高,声音质量越好。
编码:量化后的抽样信号十进制数字信号,应将十进制数字代码变换成二进制编码。
常用的采样率:
8kHz为电话采样。
11.025kHz能达到AM调幅广播的声音品质。
22.05kHzFM调频广播所用采样率。
44.1kHz音频CD,也常用于MPEG-1音频(VCD,SVCD,MP3)所用采样率。
48kHzminiDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
(9)音频存储环节扩展阅读
声音数字化过程:
比如用麦克风录下10秒的声音。声音的波形,是一条平滑的曲线,而电脑正试图在电脑上尽可能地模拟这条平滑的曲线。第一步是对曲线进行采样,假设计算机每秒对曲线进行一次采样,然后计算机在计算机上模拟10秒的声音。
但这一次我们发现模拟波形和离开原来的实际波形差异很大,可以提高计算机的采样频率,从1每秒每秒采样2次,采样频率越高,计算机模拟曲线更接近于原始声音,将恢复原来的声音。
然后第二步是量化模拟声音,和定量手段如考试成绩是51岁,60岁,65年,23岁,95年,78个这样的点,但在公布成绩,学校发现太多,成绩发布太麻烦的话,那么学校的规定,低于60点,作为一个合格的60-70分之间,71-100。
把这些不同的分数分为三个不同的年级,然后当学校公布成绩的时候,就会说,我校今年不合格的人数3人,合格的人数100人,优秀的人数500人,这是量化的。
一旦量化完成,最后一步就是编码。假设量化级别1(如不合格级别)等于0001,级别2(如合格级别)等于0011,以此类推,然后将这些级别记录为相应的0和1序列。在这里,计算机完成了将声音数字化的过程。