编译码技术的发展史
1. 技术的发展历史的分类
石器,铜器,铁器,钢,铝
产业革命的话
早期从奴隶社会进入封建社会可以看作一次农业革命,形成了农耕为主的社会生产方式
到了近代的英国资产阶级革命是第一次工业革命,从农业社会向大规模工厂化生产转变,也叫蒸汽革命,进入了蒸汽时代
然后就是19世纪末到20世纪处的第二次工业革命,从蒸汽时代进入了电气时代。
最后就是现在基本上是2战结束后开始,也有说是从70,80年代开始,计算机得到广泛应用后到来的信息时代,或者称其为第三次工业革命
2. 编译技术的发展历程
1954年至1957年间,IBM的John Backus带领一个小组开发FORTRAN语言及其编译器,使得上面的担忧不必要了。
但由于当时处理中所涉及到的大多数程序设计语言的翻译并不为人所掌握,所以这个项目的成功也伴随着巨大的辛劳。
几乎与此同时,人们也在开发着第一个编译器,Noam Chomsky开始自然语言结构的研究。使得编译器结构异常简单,甚至还带有了一些自动化。
Chomsky的研究导致了根据语言文法(grammar,结构规则)的难易程度以及识别它们所需的算法来为语言分类。文法有4个层次:0型、1型、2型和3型文法,且其中的每一个都是其前者的专门化。2型(或上下文无关文法context-free grammar)是程序设计语言中最有用的,代表着程序设计语言结构的标准方式。
人们接着又深化了生成有效的目标代码的方法,这就是最初的编译器,它们被一直使用至今。人们通常将其误称为优化技术(optimization technique),但因其从未真正地得到过被优化了的目标代码而仅仅改进了它的有效性,因此实际上应称作代码改进技术(code improvement technique)。
在70年代后期和80年代早期,大量的项目都关注于编译器其他部分的生成自动化,这其中就包括了代码生成。这些尝试并未取得多少成功,这大概是因为操作太复杂而人们又对其不甚了解。
3. 喷码技术的发展历史
喷码机理念最早于1867年,由英国物理学家LordKelvin第一次申请成专利,直到1951年,第一次作为商业化应用的工业设备由德国Siemens公司发明。20世纪90年代之前只有美、法、英、日等少数几个国家能生产这种喷码机。自90年代末,国产喷码机最早由航天部下属研究所发明以来,结束了国外产品垄断的局面,经过十多年的发展,在国内同仁的奋力追赶之下,国产喷码机在性能、稳定性的某些方面已达到或接近世界水平,目前有多家产品已远销欧美等发达国家。
4. 技术发展的历史发展
人类古代比较关键的技术发展
公元前2200年前后中国凿井取水。
公元前2130年前后中国夏禹疏导法治水成功。
公元前2100年前后美索不达米亚人有乘法表,使用60进位制。将五个行星从恒星中划出。
公元前2000年前后埃及有十进位记数法,三角形及圆面积、棱锥棱台体积的度量法。
约公元前1950年巴比伦人能解二元一次和二次方程,知道勾股定理。
公元前250年前后中国有磁指南仪“司南”记载。
105年中国蔡伦改进造纸术。
599年中国李春设计建成赵州桥。
2世纪希腊托勒玟地心说。罗马名医盖伦着述。中国华佗用麻沸散施行全身麻醉手术。
550年前后中国綦母怀文应用灌钢技术。
7—8世纪中国已用刻板印书,是世界上最早的印刷术。9世纪中国发明火药。
1041—1048年中国毕升,发明活字印刷术。
14世纪中国修明长城。中国开始应用珠算盘。
1569年荷兰墨卡托绘世界地图。
1628年英国哈维发现血液循环。
1637年法国笛卡尔创立解析几何。
公元前17世纪前后中国已开始冶铸青铜。
公元前6世纪前后中国发明了生铁冶炼技术。
战国初期中国发明了可锻铸铁。
1世纪初罗马人普里尼提出了分离金银的“烤钵法”。
1596年明代药物学家李时珍着成《本草纲目》,总结了我国明代以前的药学成就,载药1892种,是一部药物学巨着。1666年牛顿(英国,1642—1727)用三棱镜作色散实验。
1798年卡文迪许(英国,1731—1810)用扭秤法测定万有引力常数。
1820年奥斯特(丹麦,1777—1851)发现电流的磁效应。
1831年法拉第(英国,1791—1867)发现电磁感应现象。
1733年英国凯伊发明织布飞梭。
5. 语音识别技术的发展历史
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。
但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原理,研究的领域局限在特定人,小词汇表的孤立词识别,实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。
实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。
这一时期,语音识别研究进一步走向深入,其显着特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力,他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识,从而使统计方法成为了语音识别技术的主流。
统计方法将研究者的视线从微观转向宏观,不再刻意追求语音特征的细化,而是更多地从整体平均(统计)的角度来建立最佳的语音识别系统。在声学模型方面,以Markov链为基础的语音序列建模方法HMM(隐式Markov链)比较有效地解决了语音信号短时稳定、长时时变的特性,并且能根据一些基本建模单元构造成连续语音的句子模型,达到了比较高的建模精度和建模灵活性。在语言层面上,通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。另外,人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。
20世纪90年代前期,许多着名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。
其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。它带有一个32,000词的基本词汇表,可以扩展到65,000词,还包括办公常用词条,具有“纠错机制”,其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。
6. 译码器的发展
摘要 您好,我正在根据您提的问题整理答案,请稍等一会儿哦~
7. 数字技术的历史发展过程
数字化技术指的是运用0和1两位数字编码,通过电子计算机、光缆、通信卫星等设备,来表达、传输和处理所有信息的技术。数字化技术一般包括数字编码、数字压缩、数字传输、数字调制与解调等技术。
8. 哈夫曼编码的发展历史
1951年,哈夫曼和他在MIT信息论的同学需要选择是完成学期报告还是期末考试。导师Robert M. Fano给他们的学期报告的题目是,寻找最有效的二进制编码。由于无法证明哪个已有编码是最有效的,哈夫曼放弃对已有编码的研究,转向新的探索,最终发现了基于有序频率二叉树编码的想法,并很快证明了这个方法是最有效的。由于这个算法,学生终于青出于蓝,超过了他那曾经和信息论创立者香农共同研究过类似编码的导师。哈夫曼使用自底向上的方法构建二叉树,避免了次优算法Shannon-Fano编码的最大弊端──自顶向下构建树。
1952年,David A. Huffman在麻省理工攻读博士时发表了《一种构建极小多余编码的方法》(A Method for the Construction of Minimum-Rendancy Codes)一文,它一般就叫做Huffman编码。
Huffman在1952年根据香农(Shannon)在1948年和范若(Fano)在1949年阐述的这种编码思想提出了一种不定长编码的方法,也称霍夫曼(Huffman)编码。霍夫曼编码的基本方法是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。
赫夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长 度最短的码字,有时称之为最佳编码,一般就称Huffman编码。下面引证一个定理,该定理保证了按字符出现概率分配码长,可使平均码长最短。