声音在电脑中是以什么形式存储
① 请问视频,音频和图像都是以何种形式储存到电脑上的啊
在电脑上,所有文件(包括程序、游戏、操作系统、文字档案、图片、视频、声音文件等)都是以二进制存在电脑上的。作为文件,XP操作系统是这样做的,在硬盘中放置一个文件目录表和一个文件分配表(其实不止一个,有备份)里面存着每个文件的名称、大小、起始地址等等信息。(像不像派出所的户口信息?)不管找哪个文件,操作系统都帮你找到。而真正的文件(其实就是一大串01001011这样的信息)被存在硬盘的某一处。一般操作系统的文件靠前一些。
电脑是以二进制串描述东西的,比如一个32位串可以表示某一种颜色,那这种32位串可以表示多少种颜色啊?(世界上还有它表示不了的颜色吗?)但硬盘上某一处的0100111具体表示什么,只有电脑知道。
② 声音文件是怎么存储的呢
存储在计算机里的都是以二进制形式存在的,但是音频是波形的。所以要存到电脑里的话首先要解决的就是如何表示的问题,也是就是编码。然后要通过介质播放出来,这就是解码。一般的格式都有这些编码和解码功能的。CD也是以二进制形式存储的。 常见的有WAV,MP3,WMA,OGG,APE,AAC等。他们一般在编码的基础上对音频进行了压缩,解码的同时还要进行解压。
③ 电脑声音是怎么储存的
声音是通过声音的编码储存的。主要介绍波形编码中的脉冲编码调制。PCM通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
采样:一次振动中,必须有2个点的采样,关于为什么有2个点采样,我在视频课程中已经介绍了,这里不再赘述。人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。
量化:每个声音样本若用8位存储,样本只能存储0-255个信息,每个声音样本若用16位存储,则可以存储0-65535个信息,说明量化精度越高,声音质量越好。
编码:量化后的抽样信号十进制数字信号,应将十进制数字代码变换成二进制编码。
常用的采样率:
8kHz 为电话采样。
11.025kHz能达到AM调幅广播的声音品质。
22.05kHz FM调频广播所用采样率。
44.1kHz 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率。
48kHz miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
(3)声音在电脑中是以什么形式存储扩展阅读
声音数字化过程:
比如用麦克风录了一段10秒钟的声音。声音的波形,它是一段光滑的曲线,而计算机就是要尽可能的把这个光滑的曲线在电脑上模拟出来。所以第一步就是,对这曲线进行采样,比如计算机每秒对这个曲线采样1次,采样之后,计算机就把这个10秒的声音在电脑上模拟出来了。
但这时候我们发现,模拟出来的波形和左边原始真实的波形相差很大,可以提高计算机的采样频率,从每秒1次变成每秒钟采样2次,采样的频率越高,计算机模拟出来的曲线就越接近于原始声音的曲线,也就越能还原出原始的声音。
然后第二步,就是把刚才模拟出来的声音进行量化,量化的意思就是比如考试成绩有51、60、65、23、95、78这样的分数,但在公布成绩的时候,学校发现分数太多,一个一个的公布太麻烦,然后学校规定,60分以下不合格,60-70分之间为合格,71-100为优秀。
把这些不同的分数分成3个不同的等级,之后学校公布成绩的时候就说,我校本年度成绩不合格人数3人,成绩合格人数100人,成绩优秀人数500人,这个就是量化。
完成了量化之后就是最后一步,进行编码。假设量化等级一级(比如不合格这个等级)等于0001,二级(合格这个等级)等于0011,然后以此类推,依次把这些等级记录成对应的一串0和1就可以了。到这里计算机就完成了把声音数字化的过程。
④ 文本声音图像视频是如何储存到计算机里的
通过合理的编码(或者说数字化)即可保存各种多媒体信息。
对于文本而言,需要制定适当的字符编码方式。
对于声音而言,声音的本质就是振动,因此可以直接存储波形数据(WAV),也可以对波形进行分解后存储其幅频特性并压缩(MP3)。
对于图像而言,可以把图像分解成若干个小点,然后直接存储每一个点的亮度/颜色(BMP),也可以考虑利用相邻点的关系、存储基本的亮度/颜色以及一个区块变化的幅频特性并压缩(JPG)。
对于视频而言,视频的本质就是不断变化(或不变)的图像。因此可以看做单位时间内若干帧图像的处理。因此可以考虑相邻图像变化的幅频特性并压缩(M-JPG)。
⑤ 声音和图像在计算机中如何被保存
声音,也就是音频,按情况区分。声音的本质就是介质的振动,所以音频文件的本质就是怎么把这些振动情况保存下来。常见的方式有两种:一种方式是将每个细微时刻的声音的幅值都保存下来,相当于保存声音的原始波形;另一种方法则是将声音在频域进行分解,将各个时间片内各频域的声音幅值保存下来,播放时则相应要重新进行合成。
图像的本质其实跟声音差不多,也是若干个规律或不规律的采样点。所以常见的方式也有两种:一种方式是将图像划分为若干个点,保存每个点的亮度、色度值(或色度分量值);另一种方式是将图像在频域进行分解,将一个块内各个频域的信号保存下来,显示时则重新进行合成。