第章壓縮術
⑴ 數據壓縮技術的數據壓縮技術簡史
電腦里的數據壓縮其實類似於美眉們的瘦身運動,不外有兩大功用。第一,可以節省空間。拿瘦身美眉來說,要是八個美眉可以擠進一輛計程車里,那該有多省錢啊!第二,可以減少對帶寬的佔用。例如,我們都想在不到 100Kbps 的 GPRS 網上觀看 DVD 大片,這就好比瘦身美眉們總希望用一尺布裁出七件吊帶衫,前者有待於數據壓縮技術的突破性進展,後者則取決於美眉們的恆心和毅力。
簡單地說,如果沒有數據壓縮技術,我們就沒法用 WinRAR 為 Email 中的附件瘦身;如果沒有數據壓縮技術,市場上的數碼錄音筆就只能記錄不到 20 分鍾的語音;如果沒有數據壓縮技術,從 Internet 上下載一部電影也許要花半年的時間……可是這一切究竟是如何實現的呢?數據壓縮技術又是怎樣從無到有發展起來的呢? 一千多年前的中國學者就知道用「班馬」這樣的縮略語來指代班固和司馬遷,這種崇尚簡約的風俗一直延續到了今天的 Internet 時代:當我們在 BBS 上用「 7456 」代表「氣死我了」,或是用「 B4 」代表「 Before 」的時候,我們至少應該知道,這其實就是一種最簡單的數據壓縮呀。
嚴格意義上的數據壓縮起源於人們對概率的認識。當我們對文字信息進行編碼時,如果為出現概率較高的字母賦予較短的編碼,為出現概率較低的字母賦予較長的編碼,總的編碼長度就能縮短不少。遠在計算機出現之前,著名的 Morse 電碼就已經成功地實踐了這一準則。在 Morse 碼表中,每個字母都對應於一個唯一的點劃組合,出現概率最高的字母 e 被編碼為一個點「 . 」,而出現概率較低的字母 z 則被編碼為「 --.. 」。顯然,這可以有效縮短最終的電碼長度。
資訊理論之父 C. E. Shannon 第一次用數學語言闡明了概率與信息冗餘度的關系。在 1948 年發表的論文「通信的數學理論( A Mathematical Theory of Communication )」中, Shannon 指出,任何信息都存在冗餘,冗餘大小與信息中每個符號(數字、字母或單詞)的出現概率或者說不確定性有關。 Shannon 借鑒了熱力學的概念,把信息中排除了冗餘後的平均信息量稱為「信息熵」,並給出了計算信息熵的數學表達式。這篇偉大的論文後來被譽為資訊理論的開山之作,信息熵也奠定了所有數據壓縮演算法的理論基礎。從本質上講,數據壓縮的目的就是要消除信息中的冗餘,而信息熵及相關的定理恰恰用數學手段精確地描述了信息冗餘的程度。利用信息熵公式,人們可以計算出信息編碼的極限,即在一定的概率模型下,無損壓縮的編碼長度不可能小於信息熵公式給出的結果。
有了完備的理論,接下來的事就是要想辦法實現具體的演算法,並盡量使演算法的輸出接近信息熵的極限了。當然,大多數工程技術人員都知道,要將一種理論從數學公式發展成實用技術,就像僅憑一個 E=mc 2 的公式就要去製造核武器一樣,並不是一件很容易的事。 設計具體的壓縮演算法的過程通常更像是一場數學游戲。開發者首先要尋找一種能盡量精確地統計或估計信息中符號出現概率的方法,然後還要設計一套用最短的代碼描述每個符號的編碼規則。統計學知識對於前一項工作相當有效,迄今為止,人們已經陸續實現了靜態模型、半靜態模型、自適應模型、 Markov 模型、部分匹配預測模型等概率統計模型。相對而言,編碼方法的發展歷程更為曲折一些。
1948 年, Shannon 在提出信息熵理論的同時,也給出了一種簡單的編碼方法—— Shannon 編碼。 1952 年, R. M. Fano 又進一步提出了 Fano 編碼。這些早期的編碼方法揭示了變長編碼的基本規律,也確實可以取得一定的壓縮效果,但離真正實用的壓縮演算法還相去甚遠。
第一個實用的編碼方法是由 D. A. Huffman 在 1952 年的論文「最小冗餘度代碼的構造方法( A Method for the Construction of Minimum Rendancy Codes )」中提出的。直到今天,許多《數據結構》教材在討論二叉樹時仍要提及這種被後人稱為 Huffman 編碼的方法。 Huffman 編碼在計算機界是如此著名,以至於連編碼的發明過程本身也成了人們津津樂道的話題。據說, 1952 年時,年輕的 Huffman 還是麻省理工學院的一名學生,他為了向老師證明自己可以不參加某門功課的期末考試,才設計了這個看似簡單,但卻影響深遠的編碼方法。
Huffman 編碼效率高,運算速度快,實現方式靈活,從 20 世紀 60 年代至今,在數據壓縮領域得到了廣泛的應用。例如,早期 UNIX 系統上一個不太為現代人熟知的壓縮程序 COMPACT 實際就是 Huffman 0 階自適應編碼的具體實現。 20 世紀 80 年代初, Huffman 編碼又出現在 CP/M 和 DOS 系統中,其代表程序叫 SQ 。今天,在許多知名的壓縮工具和壓縮演算法(如 WinRAR 、 gzip 和 JPEG )里,都有 Huffman 編碼的身影。不過, Huffman 編碼所得的編碼長度只是對信息熵計算結果的一種近似,還無法真正逼近信息熵的極限。正因為如此,現代壓縮技術通常只將 Huffman 視作最終的編碼手段,而非數據壓縮演算法的全部。
科學家們一直沒有放棄向信息熵極限挑戰的理想。 1968 年前後, P. Elias 發展了 Shannon 和 Fano 的編碼方法,構造出從數學角度看來更為完美的 Shannon-Fano-Elias 編碼。沿著這一編碼方法的思路, 1976 年, J. Rissanen 提出了一種可以成功地逼近信息熵極限的編碼方法——算術編碼。 1982 年, Rissanen 和 G. G. Langdon 一起改進了算術編碼。之後,人們又將算術編碼與 J. G. Cleary 和 I. H. Witten 於 1984 年提出的部分匹配預測模型( PPM )相結合,開發出了壓縮效果近乎完美的演算法。今天,那些名為 PPMC 、 PPMD 或 PPMZ 並號稱壓縮效果天下第一的通用壓縮演算法,實際上全都是這一思路的具體實現。
對於無損壓縮而言, PPM 模型與算術編碼相結合,已經可以最大程度地逼近信息熵的極限。看起來,壓縮技術的發展可以到此為止了。不幸的是,事情往往不像想像中的那樣簡單:算術編碼雖然可以獲得最短的編碼長度,但其本身的復雜性也使得算術編碼的任何具體實現在運行時都慢如蝸牛。即使在摩爾定律大行其道, CPU 速度日新月異的今天,算術編碼程序的運行速度也很難滿足日常應用的需求。沒辦法,如果不是後文將要提到的那兩個猶太人,我們還不知要到什麼時候才能用上 WinZIP 這樣方便實用的壓縮工具呢。 逆向思維永遠是科學和技術領域里出奇制勝的法寶。就在大多數人絞盡腦汁想改進 Huffman 或算術編碼,以獲得一種兼顧了運行速度和壓縮效果的「完美」編碼的時候,兩個聰明的猶太人 J. Ziv 和 A. Lempel 獨辟蹊徑,完全脫離 Huffman 及算術編碼的設計思路,創造出了一系列比 Huffman 編碼更有效,比算術編碼更快捷的壓縮演算法。我們通常用這兩個猶太人姓氏的縮寫,將這些演算法統稱為 LZ 系列演算法。
按照時間順序, LZ 系列演算法的發展歷程大致是: Ziv 和 Lempel 於 1977 年發表題為「順序數據壓縮的一個通用演算法( A Universal Algorithm for Sequential Data Compression )」的論文,論文中描述的演算法被後人稱為 LZ77 演算法。 1978 年,二人又發表了該論文的續篇「通過可變比率編碼的獨立序列的壓縮( Compression of Indivial Sequences via Variable Rate Coding )」,描述了後來被命名為 LZ78 的壓縮演算法。 1984 年, T. A. Welch 發表了名為「高性能數據壓縮技術( A Technique for High Performance Data Compression )」的論文,描述了他在 Sperry 研究中心(該研究中心後來並入了 Unisys 公司)的研究成果,這是 LZ78 演算法的一個變種,也就是後來非常有名的 LZW 演算法。 1990 年後, T. C. Bell 等人又陸續提出了許多 LZ 系列演算法的變體或改進版本。
說實話, LZ 系列演算法的思路並不新鮮,其中既沒有高深的理論背景,也沒有復雜的數學公式,它們只是簡單地延續了千百年來人們對字典的追崇和喜好,並用一種極為巧妙的方式將字典技術應用於通用數據壓縮領域。通俗地說,當你用字典中的頁碼和行號代替文章中每個單詞的時候,你實際上已經掌握了 LZ 系列演算法的真諦。這種基於字典模型的思路在表面上雖然和 Shannon 、 Huffman 等人開創的統計學方法大相徑庭,但在效果上一樣可以逼近信息熵的極限。而且,可以從理論上證明, LZ 系列演算法在本質上仍然符合信息熵的基本規律。
LZ 系列演算法的優越性很快就在數據壓縮領域里體現 了 出來,使用 LZ 系列演算法的工具軟體數量呈爆炸式增長。 UNIX 系統上最先出現了使用 LZW 演算法的 compress 程序,該程序很快成為了 UNIX 世界的壓縮標准。緊隨其後的是 MS-DOS 環境下的 ARC 程序,以及 PKWare 、 PKARC 等仿製品。 20 世紀 80 年代,著名的壓縮工具 LHarc 和 ARJ 則是 LZ77 演算法的傑出代表。
今天, LZ77 、 LZ78 、 LZW 演算法以及它們的各種變體幾乎壟斷了整個通用數據壓縮領域,我們熟悉的 PKZIP 、 WinZIP 、 WinRAR 、 gzip 等壓縮工具以及 ZIP 、 GIF 、 PNG 等文件格式都是 LZ 系列演算法的受益者,甚至連 PGP 這樣的加密文件格式也選擇了 LZ 系列演算法作為其數據壓縮的標准。
沒有誰能否認兩位猶太人對數據壓縮技術的貢獻。我想強調的只是,在工程技術領域,片面追求理論上的完美往往只會事倍功半,如果大家能像 Ziv 和 Lempel 那樣,經常換個角度來思考問題,沒准兒你我就能發明一種新的演算法,就能在技術方展史上揚名立萬呢。 LZ 系列演算法基本解決了通用數據壓縮中兼顧速度與壓縮效果的難題。但是,數據壓縮領域里還有另一片更為廣闊的天地等待著我們去探索。 Shannon 的資訊理論告訴我們,對信息的先驗知識越多,我們就可以把信息壓縮得越小。換句話說,如果壓縮演算法的設計目標不是任意的數據源,而是基本屬性已知的特種數據,壓縮的效果就會進一步提高。這提醒我們,在發展通用壓縮演算法之餘,還必須認真研究針對各種特殊數據的專用壓縮演算法。比方說,在今天的數碼生活中,遍布於數碼相機、數碼錄音筆、數碼隨身聽、數碼攝像機等各種數字設備中的圖像、音頻、視頻信息,就必須經過有效的壓縮才能在硬碟上存儲或是通過 USB 電纜傳輸。實際上,多媒體信息的壓縮一直是數據壓縮領域里的重要課題,其中的每一個分支都有可能主導未來的某個技術潮流,並為數碼產品、通信設備和應用軟體開發商帶來無限的商機。
讓我們先從圖像數據的壓縮講起。通常所說的圖像可以被分為二值圖像、灰度圖像、彩色圖像等不同的類型。每一類圖像的壓縮方法也不盡相同。
傳真技術的發明和廣泛使用促進了二值圖像壓縮演算法的飛速發展。 CCITT (國際電報電話咨詢委員會,是國際電信聯盟 ITU 下屬的一個機構)針對傳真類應用建立了一系列圖像壓縮標准,專用於壓縮和傳遞二值圖像。這些標准大致包括 20 世紀 70 年代後期的 CCITT Group 1 和 Group 2 , 1980 年的 CCITT Group 3 ,以及 1984 年的 CCITT Group 4 。為了適應不同類型的傳真圖像,這些標准所用的編碼方法包括了一維的 MH 編碼和二維的 MR 編碼,其中使用了行程編碼( RLE )和 Huffman 編碼等技術。今天,我們在辦公室或家裡收發傳真時,使用的大多是 CCITT Group 3 壓縮標准,一些基於數字網路的傳真設備和存放二值圖像的 TIFF 文件則使用了 CCITT Group 4 壓縮標准。 1993 年, CCITT 和 ISO (國際標准化組織)共同成立的二值圖像聯合專家組( Joint Bi-level Image Experts Group , JBIG )又將二值圖像的壓縮進一步發展為更加通用的 JBIG 標准。
實際上,對於二值圖像和非連續的灰度、彩色圖像而言,包括 LZ 系列演算法在內的許多通用壓縮演算法都能獲得很好的壓縮效果。例如,誕生於 1987 年的 GIF 圖像文件格式使用的是 LZW 壓縮演算法, 1995 年出現的 PNG 格式比 GIF 格式更加完善,它選擇了 LZ77 演算法的變體 zlib 來壓縮圖像數據。此外,利用前面提到過的 Huffman 編碼、算術編碼以及 PPM 模型,人們事實上已經構造出了許多行之有效的圖像壓縮演算法。
但是,對於生活中更加常見的,像素值在空間上連續變化的灰度或彩色圖像(比如數碼照片),通用壓縮演算法的優勢就不那麼明顯了。幸運的是,科學家們發現,如果在壓縮這一類圖像數據時允許改變一些不太重要的像素值,或者說允許損失一些精度(在壓縮通用數據時,我們絕不會容忍任何精度上的損失,但在壓縮和顯示一幅數碼照片時,如果一片樹林里某些樹葉的顏色稍微變深了一些,看照片的人通常是察覺不到的),我們就有可能在壓縮效果上獲得突破性的進展。這一思想在數據壓縮領域具有革命性的地位:通過在用戶的忍耐范圍內損失一些精度,我們可以把圖像(也包括音頻和視頻)壓縮到原大小的十分之一、百分之一甚至千分之一,這遠遠超出了通用壓縮演算法的能力極限。也許,這和生活中常說的「退一步海闊天空」的道理有異曲同工之妙吧。
這種允許精度損失的壓縮也被稱為有損壓縮。在圖像壓縮領域,著名的 JPEG 標準是有損壓縮演算法中的經典。 JPEG 標准由靜態圖像聯合專家組( Joint Photographic Experts Group , JPEG )於 1986 年開始制定, 1994 年後成為國際標准。 JPEG 以離散餘弦變換( DCT )為核心演算法,通過調整質量系數控制圖像的精度和大小。對於照片等連續變化的灰度或彩色圖像, JPEG 在保證圖像質量的前提下,一般可以將圖像壓縮到原大小的十分之一到二十分之一。如果不考慮圖像質量, JPEG 甚至可以將圖像壓縮到「無限小」。
JPEG 標準的最新進展是 1996 年開始制定, 2001 年正式成為國際標準的 JPEG 2000 。與 JPEG 相比, JPEG 2000 作了大幅改進,其中最重要的是用離散小波變換( DWT )替代了 JPEG 標准中的離散餘弦變換。在文件大小相同的情況下, JPEG 2000 壓縮的圖像比 JPEG 質量更高,精度損失更小。作為一個新標准, JPEG 2000 暫時還沒有得到廣泛的應用,不過包括數碼相機製造商在內的許多企業都對其應用前景表示樂觀, JPEG 2000 在圖像壓縮領域里大顯身手的那一天應該不會特別遙遠。
JPEG 標准中通過損失精度來換取壓縮效果的設計思想直接影響了視頻數據的壓縮技術。 CCITT 於 1988 年制定了電視電話和會議電視的 H.261 建議草案。 H.261 的基本思路是使用類似 JPEG 標準的演算法壓縮視頻流中的每一幀圖像,同時採用運動補償的幀間預測來消除視頻流在時間維度上的冗餘信息。在此基礎上, 1993 年, ISO 通過了動態圖像專家組( Moving Picture Experts Group , MPEG )提出的 MPEG-1 標准。 MPEG-1 可以對普通質量的視頻數據進行有效編碼。我們現在看到的大多數 VCD 影碟,就是使用 MPEG-1 標准來壓縮視頻數據的。
為了支持更清晰的視頻圖像,特別是支持數字電視等高端應用, ISO 於 1994 年提出了新的 MPEG-2 標准(相當於 CCITT 的 H.262 標准)。 MPEG-2 對圖像質量作了分級處理,可以適應普通電視節目、會議電視、高清晰數字電視等不同質量的視頻應用。在我們的生活中,可以提供高清晰畫面的 DVD 影碟所採用的正是 MPEG-2 標准。
Internet 的發展對視頻壓縮提出了更高的要求。在內容交互、對象編輯、隨機存取等新需求的刺激下, ISO 於 1999 年通過了 MPEG-4 標准(相當於 CCITT 的 H.263 和 H.263+ 標准)。 MPEG-4 標准擁有更高的壓縮比率,支持並發數據流的編碼、基於內容的交互操作、增強的時間域隨機存取、容錯、基於內容的尺度可變性等先進特性。 Internet 上新興的 DivX 和 XviD 文件格式就是採用 MPEG-4 標准來壓縮視頻數據的,它們可以用更小的存儲空間或通信帶寬提供與 DVD 不相上下的高清晰視頻,這使我們在 Internet 上發布或下載數字電影的夢想成為了現實。
就像視頻壓縮和電視產業的發展密不可分一樣,音頻數據的壓縮技術最早也是由無線電廣播、語音通信等領域里的技術人員發展起來的。這其中又以語音編碼和壓縮技術的研究最為活躍。自從 1939 年 H. Dudley 發明聲碼器以來,人們陸續發明了脈沖編碼調制( PCM )、線性預測( LPC )、矢量量化( VQ )、自適應變換編碼( ATC )、子帶編碼( SBC )等語音分析與處理技術。這些語音技術在採集語音特徵,獲取數字信號的同時,通常也可以起到降低信息冗餘度的作用。像圖像壓縮領域里的 JPEG 一樣,為獲得更高的編碼效率,大多數語音編碼技術都允許一定程度的精度損失。而且,為了更好地用二進制數據存儲或傳送語音信號,這些語音編碼技術在將語音信號轉換為數字信息之後又總會用 Huffman 編碼、算術編碼等通用壓縮演算法進一步減少數據流中的冗餘信息。
對於電腦和數字電器(如數碼錄音筆、數碼隨身聽)中存儲的普通音頻信息,我們最常使用的壓縮方法主要是 MPEG 系列中的音頻壓縮標准。例如, MPEG-1 標准提供了 Layer I 、 Layer II 和 Layer III 共三種可選的音頻壓縮標准, MPEG-2 又進一步引入了 AAC ( Advanced Audio Coding )音頻壓縮標准, MPEG-4 標准中的音頻部分則同時支持合成聲音編碼和自然聲音編碼等不同類型的應用。在這許多音頻壓縮標准中,聲名最為顯赫的恐怕要數 MPEG-1 Layer III ,也就是我們常說的 MP3 音頻壓縮標准了。從 MP3 播放器到 MP3 手機,從硬碟上堆積如山的 MP3 文件到 Internet 上版權糾紛不斷的 MP3 下載, MP3 早已超出了數據壓縮技術的范疇,而成了一種時尚文化的象徵了。
很顯然,在多媒體信息日益成為主流信息形態的數字化時代里,數據壓縮技術特別是專用於圖像、音頻、視頻的數據壓縮技術還有相當大的發展空間——畢竟,人們對信息數量和信息質量的追求是永無止境的。 從信息熵到算術編碼,從猶太人到 WinRAR ,從 JPEG 到 MP3 ,數據壓縮技術的發展史就像是一個寫滿了「創新」、「挑戰」、「突破」和「變革」的羊皮卷軸。也許,我們在這里不厭其煩地羅列年代、人物、標准和文獻,其目的只是要告訴大家,前人的成果只不過是後人有望超越的目標而已,誰知道在未來的幾年裡,還會出現幾個 Shannon ,幾個 Huffman 呢?
談到未來,我們還可以補充一些與數據壓縮技術的發展趨勢有關的話題。
1994年, M. Burrows 和 D. J. Wheeler 共同提出了一種全新的通用數據壓縮演算法。這種演算法的核心思想是對字元串輪轉後得到的字元矩陣進行排序和變換,類似的變換演算法被稱為 Burrows-Wheeler 變換,簡稱 BWT 。與 Ziv 和 Lempel 另闢蹊徑的做法如出一轍, Burrows 和 Wheeler 設計的 BWT 演算法與以往所有通用壓縮演算法的設計思路都迥然不同。如今, BWT 演算法在開放源碼的壓縮工具 bzip 中獲得了巨大的成功, bzip 對於文本文件的壓縮效果要遠好於使用 LZ 系列演算法的工具軟體。這至少可以表明,即便在日趨成熟的通用數據壓縮領域,只要能在思路和技術上不斷創新,我們仍然可以找到新的突破口。
分形壓縮技術是圖像壓縮領域近幾年來的一個熱點。這一技術起源於 B. Mandelbrot 於 1977 年創建的分形幾何學。 M. Barnsley 在 20 世紀 80 年代後期為分形壓縮奠定了理論基礎。從 20 世紀 90 年代開始, A. Jacquin 等人陸續提出了許多實驗性的分形壓縮演算法。今天,很多人相信,分形壓縮是圖像壓縮領域里最有潛力的一種技術體系,但也有很多人對此不屑一顧。無論其前景如何,分形壓縮技術的研究與發展都提示我們,在經過了幾十年的高速發展之後,也許,我們需要一種新的理論,或是幾種更有效的數學模型,以支撐和推動數據壓縮技術繼續向前躍進。
人工智慧是另一個可能對數據壓縮的未來產生重大影響的關鍵詞。既然 Shannon 認為,信息能否被壓縮以及能在多大程度上被壓縮與信息的不確定性有直接關系,假設人工智慧技術在某一天成熟起來,假設計算機可以像人一樣根據已知的少量上下文猜測後續的信息,那麼,將信息壓縮到原大小的萬分之一乃至十萬分之一,恐怕就不再是天方夜譚了。
回顧歷史之後,人們總喜歡暢想一下未來。但未來終究是未來,如果僅憑你我幾句話就可以理清未來的技術發展趨勢,那技術創新的工作豈不就索然無味了嗎?依我說,未來並不重要,重要的是,趕快到 Internet 上下載幾部大片,然後躺在沙發里,好好享受一下數據壓縮為我們帶來的無限快樂吧。
⑵ 高分求超級壓縮術!
我可以告訴你,
壓縮和文件的格式有關,比如用一種AVI格式的,可以像你說的那樣,不過如果其它的,如rm,mpg,等這樣的音頻格式文件壓縮比率是很不的,
你問的這樣的大比率壓縮軟體不存在,如果有人給你說存在的話,他是騙你的.
⑶ 數字電視的視頻壓縮技術
論文題目是:數字電視接收機的視頻壓縮技術
幫寫內容:(1)選題依據及研究意義;
(2) 選題研究現狀;
(3)研究內容(包括基本思路、框架、主要研究方式、方法
等)
一共是三點,請大家教一下我這三點該怎麼寫?!
註明:論文我已經寫好了:下面是論文提綱(含論文選題、論文主體框架)
論文選題:數字電視接收機的視頻壓縮技術
第一章:緒論
一、數字電視的發展及視頻壓縮的必要性;
二、視頻圖象數字壓縮的客觀依據;
三、數字電視與接收機(機頂盒);
四、電視信號模數轉換標准;
第二章:數字電視機頂盒技術
一、什麼是數字電視機頂盒;
二、數字電視機頂盒的基本原理;
三、數字電視機頂盒的結構;
四、數字電視機頂盒的主要技術;
第三章:視頻壓縮編碼技術
一 空間或時間性編碼;
二. 加權;
三. 遍歷(Scannng);
四. 熵編碼;
五. 空間性編碼器;
六. 時間性編碼;
七. 運動補償;
八. 雙向編碼;
九. I、P 和B 畫面;
十. MPEG 壓縮器;
十一. 預處理;
十二. 類和級;
十三. 小波;
第四章:視頻圖象壓縮標准
一、H.261標准;
二、JPEG標准;
三、MPEG-1壓縮編碼標准;
四、MPEG-2壓縮編碼標准;
五、MPEG-4壓縮編碼標准;
結束語 ;
參考文獻 ;
問題補充:題目是學校幫我選擇的! 大家可以幫忙把這三點寫一下嗎? 我真不知道該怎麼寫! 或者大家幫我寫前兩點也好了~ 謝謝幫我忙的所有朋友! 拜託各位了!我開題16號就要交了
看看這個能不能幫您!
一、如何選擇問題
我一起縈繞於懷的,是在寫博士論文開題報告的一年多時間里,導師薛瀾教授反復追問的一個問題:「你的 puzzle 是什麼?」多少次我不假思索地回答「我的問題就是,中國的半導體產業為什麼發展不起來。」薛老師問題以其特有的儲蓄,笑而不答。我在心中既惱火又懊喪:這么簡單的道理,這么明顯的答案,到底哪兒不對了?!
奧妙就在於提出問題的「層次」。不同於政策研究報告,學術文章聚集理論層面、解決理論問題。理論是由一系列前設和術語構造的邏輯體系。特定領域的理論有其特定的概念、范疇和研究範式。只有在相同的概念、視角和範式下,理論才能夠對話;只有通過對話,理論才能夠發展。極少有碩博論文是創造新理論的,能這樣當然最好,但難度很大。我們多數是在既有理論的基礎上加以發展,因此,在提出問題時,要以「內行」看得懂的術語和明確的邏輯來表述。審視我最初提出的問題「中國半導體產業為什麼發展不起來」,這僅僅是對現象的探詢,而非有待求證的理論命題。我的理論命題是:「中國產業政策過程是精英主導的共識過程嗎?」在這個命題中,「政策過程」、「精英政治」、「共識訴求」三個術語勾勒出研究的理論大體范圍和視角。
其次,選擇問題是一個「剝筍」的過程。理論問題總是深深地隱藏在紛繁復雜的現實背後,而發現理論問題,則需要運用理論思維的能力。理論思維的訓練是一個長期積累的過程。不過初學者也不必望而卻步,大體上可以分「三步走」:第一步,先劃定一個「興趣范圍」,如半導體產業、信息產業、農村醫療、高等教育體制等,廣泛瀏覽相關的媒體報道、政府文獻和學術文章,找到其中的「症結」或「熱點」。第二步,總結以往的研究者大體從哪些理論視角來分析「症結」或「熱點」、運用了哪些理論工具,如公共財政的視角、社會沖突範式等。第三步,考察問題的可研究性,也就是我們自己的研究空間和研究的可行性。例如,西方的理論是否無法解釋中國的問題?或者同一個問題能否用不同的理論來解釋?或者理論本身的前提假設、邏輯推演是否存在缺陷?通過回答這些問題,我們找到自己研究的立足點。不過還要注意我們研究在規定的一到兩年時間內,是否可能完成?資料獲取是否可行?等等。
最後,如何陳述問題?陳述問題實質上就是凝練核心觀點的過程。觀點應當來自對現實問題的思考和總結,而不是為了套理論而「削足適履」。中國的政治、經濟和社會發展充滿動態的、豐富的景象,如何才能用恰當的術語、准確的邏輯表述出來呢?雄心勃勃的初學者往往提出宏偉的概念或框架,但我的建議是盡可能縮小研究范圍、明確研究對象,從而理清對象的內存邏輯,保證能在有限的時間內完成規范的學
術論文。如「中國半導體產業政策研究」就是一個非常含糊的陳述,我們可以從幾個方面來收縮話題:( 1 )時間:從 1980 年到 2000 年;( 2 )對象:政府的叛亂者和決策行為,而不是市場、企業、治理結構等;( 3 )視角:政治和政府理論中的精英研究;( 4 )案例: 908 工程、 909 工程、 13 號文件和《電子振興》,這是發生在 1980 - 2000 年間半導體政策領域的兩個重大工程和兩個重要文件。通過這樣的明確界定,我們將目光集中在「政策過程」、「精英」、「共識」幾個顯而易見的概念上,問題也就水落石出了。同時,問題清楚了,我們在篩選信息和資料時也就有了明確的標准,在這個「信息冗餘」的時代,能夠大大提高研究效率。
二、 如何做文獻綜述
首先需要將「文獻綜述( Literature Review) 」與「背景描述 (Backupground Description) 」區分開來。我們在選擇研究問題的時候,需要了解該問題產生的背景和來龍去脈,如「中國半導體產業的發展歷程」、「國外政府發展半導體產業的政策和問題」等等,這些內容屬於「背景描述」,關注的是現實層面的問題,嚴格講不是「文獻綜述」,關注的是現實層面問題,嚴格講不是「文獻綜述」。「文獻綜述」是對學術觀點和理論方法的整理。其次,文獻綜述是評論性的( Review 就是「評論」的意思),因此要帶著作者本人批判的眼光 (critical thinking) 來歸納和評論文獻,而不僅僅是相關領域學術研究的「堆砌」。評論的主線,要按照問題展開,也就是說,別的學者是如何看待和解決你提出的問題的,他們的方法和理論是否有什麼缺陷?要是別的學者已經很完美地解決了你提出的問題,那就沒有重復研究的必要了。
清楚了文獻綜述的意涵,現來說說怎麼做文獻綜述。雖說,盡可能廣泛地收集資料是負責任的研究態度,但如果缺乏標准,就極易將人引入文獻的泥沼。
技巧一:瞄準主流。主流文獻,如該領域的核心期刊、經典著作、專職部門的研究報告、重要化合物的觀點和論述等,是做文獻綜述的「必修課」。而多數大眾媒體上的相關報道或言論,雖然多少有點價值,但時間精力所限,可以從簡。怎樣摸清該領域的主流呢?建議從以下幾條途徑入手:一是圖書館的中外學術期刊,找到一兩篇「經典」的文章後「順藤摸瓜」,留意它們的參考文獻。質量較高的學術文章,通常是不會忽略該領域的主流、經典文獻的。二是利用學校圖書館的「中國期刊網」、「外文期刊資料庫檢索」和外文過刊閱覽室,能夠查到一些較為早期的經典文獻。三是國家圖書館,有些上世紀七八十年代甚至更早出版的社科圖書,學校圖書館往往沒有收藏,但是國圖卻是一本不少(國內出版的所有圖書都要送繳國家圖書館),不僅如此,國圖還收藏了很多研究中國政治和政府的外文書籍,從互聯網上可以輕松查詢到。
技巧二:隨時整理,如對文獻進行分類,記錄文獻信息和藏書地點。做博士論文的時間很長,有的文獻看過了當時不一定有用,事後想起來卻找不著了,所以有時記錄是很有必要的。羅僕人就積累有一份研究中國政策過程的書單,還特別記錄了圖書分類號碼和藏書地點。同時,對於特別重要的文獻,不妨做一個讀書筆記,摘錄其中的重要觀點和論述。這樣一步一個腳印,到真正開始寫論文時就積累了大量「干貨」,可以隨時享用。
技巧三:要按照問題來組織文獻綜述。看過一些文獻以後,我們有很強烈的願望要把自己看到的東西都陳述出來,像「竹筒倒豆子」一樣,洋洋灑灑,蔚為壯觀。彷彿一定要向讀者證明自己勞苦功高。我寫過十多萬字的文獻綜述,後來發覺真正有意義的不過數千字。文獻綜述就像是在文獻的叢林中開辟道路,這條道路本來就是要指向我們所要解決的問題,當然是直線距離最短、最省事,但是一路上風景頗多,迷戀風景的人便往往繞行於迤邐的叢林中,反面「亂花漸欲迷人眼」,「曲徑通幽」不知所終了。因此,在做文獻綜述時,頭腦時刻要清醒:我要解決什麼問題,人家是怎麼解決問題的,說的有沒有道理,就行了。
三、如何撰寫開題報告
問題清楚了,文獻綜述也做過了,開題報告便呼之欲出。事實也是如此,一個清晰的問題,往往已經隱含著論文的基本結論;對現有文獻的缺點的評論,也基本暗含著改進的方向。開題報告就是要把這些暗含的結論、論證結論的邏輯推理,清楚地展現出來。
寫開題報告的目的,是要請老師和專家幫我們判斷一下:這個問題有沒有研究價值、這個研究方法有沒有可能奏效、這個論證邏輯有沒有明顯缺陷。因此,開題報告的主要內容,就要按照「研究目的和意義」、「文獻綜述和理論空間」、「基本論點和研究方法」、「資料收集方法和工作步驟」這樣幾個方面展開。其中,「基本論點和研究方法」是重點,許多人往往花費大量筆墨鋪陳文獻綜述,但一談到自己的研究方法時但寥寥數語、一掠而過。這樣的話,評審老師怎麼能判斷出你的研究前景呢?又怎麼能對你的研究方法給予切實的指導和建議呢?
對於不同的選題,研究方法有很大的差異。一個嚴謹規范的學術研究,必須以嚴謹規范的方法為支撐。在博士生課程的日常教學中,有些老師致力於傳授研究方法;有的則突出討論方法論的問題。這都有利於我們每一個人提高自己對研究方法的認識、理解、選擇與應用,並具體實施於自己的論文工作中。
⑷ 請問第一腰椎壓縮性骨折,約1/2,四肢有力,大小便正常,核磁顯示壓縮骨折伴硬膜囊下腫,請問是手術,
病情分析:
你好,壓縮性骨折患者在進行腰部鍛煉的同時,應注意四肢各關節的活動,以預防肢體肌肉廢用性萎縮、關節攣縮和骨骼脫鈣。下肢各關節有節律運動能促進血液循環,防止下肢血栓形成。
指導意見:
患者還應加強呼吸功能鍛煉,以維持正常的肺功能。常用的方法有深呼吸、縮唇呼吸(如吹口哨樣)等。
⑸ 多媒體技術這門課程第四章數據壓縮與編碼的知識點有哪些
多媒體技術這門課第四章數據壓縮與編碼的知識點包含章節導引,第一節數據壓縮與編碼簡介,第二節信息熵編碼,第三節變換編碼,第四節預測編碼,第五節模型和混合編碼,第六節音頻壓縮編碼,第七節圖像壓縮編碼,第八節視頻壓縮編碼,課後練習,。
⑹ 第一腰椎壓縮性骨折手術適應症
椎體壓縮超過三分之一或有椎管骨性狹窄或有神經壓迫症狀
⑺ 壓縮技術的壓縮技術
壓縮技術 Compression Techniques 基本的壓縮技術有:
空格壓縮(Null Compression) 將一串空格用一個壓縮碼代替,壓縮碼後面的數值代表空格的個數。
游長壓縮(Run-Length Compression)它是空格壓縮技術的擴充,壓縮任何4個或更多的重復字元的串。該字元串被一個壓縮碼、一個重復字元和一個代表重復字元個數的值所取代。
關鍵字編碼(Key-word encoding)創建一張由表示普通字元集的值所組成的表。頻繁出現的單詞如for、the或字元對如sh、th,被表示為一些標記(token),用來保存或傳送這些字元。
哈夫曼統計方法(Huffman statistical method)這種壓縮技術假定數據中的字元有一個變化分布,換句話說,有些字元的出現次數比其餘的多。字元出現越頻繁,用於編碼的位數就越少。這種編碼方案保存在一張表中,在數據傳輸時,它能被傳送到接收方數據機使其知道如何解碼字元。
因為壓縮演算法是基於軟體的,所以實時環境中,存在著額外開銷,會引起不少問題。而文件備份、歸檔過程中的壓縮不會有什麼問題。使用高性能的系統有助於消除大部分的額外開銷和性能問題。另外,壓縮消除了文件的可移植性,除非解壓縮軟體也與文件一起傳送。
注意,有些文件已經被壓縮,進一步的外部壓縮不會有任何好處,一些圖形文件格式,如標簽映象文件格式(TIFF),就已經包含了壓縮。 Storage System Compression存儲系統壓縮
在討論文件存儲的壓縮演算法之前,應該明確文件壓縮不同於磁碟編碼。磁碟編碼通常由磁碟驅動器把更多的數字1和0寫到磁碟的物理表面上。文件壓縮把文件中的字元和位串擠壓到更小的尺寸。它在文件信息傳送到硬碟驅動器的寫頭之前由軟體完成。現代的使用編碼的硬碟驅動器只是從CPU接收1和o的位流,並且把它們壓擠到比沒有使用編碼小得多的空間中。磁碟編碼簡單討論到這兒,下面將著重討論文件壓縮。
磁碟記錄系統如硬碟驅動器通過改變磁碟表面的磁場來記錄信息。兩種可能狀態間的磁場變化稱為磁通翻轉(flux transition)。簡單地說,磁通翻轉代表數字1,磁通不翻轉代表數字0。編碼提供了一種方法使每個磁通翻轉代表更多數字信息。改進調頻制MFM(Modified frequency molation)將一個磁通翻轉表示多個1,將磁通不翻轉表示多個0。編碼技術包括下述幾種。
游長受限碼(Run Length limited(RLU))把位組合格式表示為代碼,可以用較少的磁通翻轉來存儲。與MFM相比,存儲容量提高了50%。
改進的游長受限碼(Advanced run length limited(ARLL) 通過把位組合格式轉換成能用四倍密度磁通翻轉來存儲的代碼,從而把MFM的記錄密度翻了一倍。
因為磁碟編碼是由硬碟驅動器在硬體級自動處理的,這里沒有必要進一步討論。當你購買一個硬碟驅動器,它使用一種編碼方案而獲得一定的容量,但是只要驅動器的容量滿足你的要求,購買後,就不必關心它的編碼方案了。
⑻ 什麼是壓縮技術,起源於什麼時候
因為有些文件格式相對較大。。比如BMP格式的圖片。壓縮比較基本上在100倍左右。。因此為了節省空間。。就需要對數據進行壓縮
1.什麼是數據壓縮
數據壓縮,通俗地說,就是用最少的數碼來表示信號。其作用是:能較快地傳輸各種信號,如傳真、Modem通信等;在現有的通信干線並行開通更多的多媒體業務,如各種增值業務;緊縮數據存儲容量,如CD-ROM、VCD和DVD等;降低發信機功率,這對於多媒體移動通信系統尤為重要。由此看來,通信時間、傳輸帶寬、存儲空間甚至發射能量,都可能成為數據壓縮的對象。
2.數據為何能被壓縮
首先,數據中間常存在一些多餘成分,既冗餘度。如在一份計算機文件中,某些符號會重復出現、某些符號比其他符號出現得更頻繁、某些字元總是在各數據塊中可預見的位置上出現等,這些冗餘部分便可在數據編碼中除去或減少。冗餘度壓縮是一個可逆過程,因此叫做無失真壓縮,或稱保持型編碼。
其次,數據中間尤其是相鄰的數據之間,常存在著相關性。如圖片中常常有色彩均勻的背影,電視信號的相鄰兩幀之間可能只有少量的變化影物是不同的,聲音信號有時具有一定的規律性和周期性等等。因此,有可能利用某些變換來盡可能地去掉這些相關性。但這種變換有時會帶來不可恢復的損失和誤差,因此叫做不可逆壓縮,或稱有失真編碼、摘壓縮等。
此外,人們在欣賞音像節目時,由於耳、目對信號的時間變化和幅度變化的感受能力都有一定的極限,如人眼對影視節目有視覺暫留效應,人眼或人耳對低於某一極限的幅度變化已無法感知等,故可將信號中這部分感覺不出的分量壓縮掉或「掩蔽掉」。這種壓縮方法同樣是一種不可逆壓縮。
對於數據壓縮技術而言,最基本的要求就是要盡量降低數字化的在碼事,同時仍保持一定的信號質量。不難想像,數據壓縮的方法應該是很多的,但本質上不外乎上述完全可逆的冗餘度壓縮和實際上不可逆的嫡壓縮兩類。冗餘度壓縮常用於磁碟文件、數據通信和氣象衛星雲圖等不允許在壓縮過程中有絲毫損失的場合中,但它的壓縮比通常只有幾倍,遠遠不能滿足數字視聽應用的要求。
在實際的數字視聽設備中,差不多都採用壓縮比更高但實際有損的媳壓縮技術。只要作為最終用戶的人覺察不出或能夠容忍這些失真,就允許對數字音像信號進一步壓縮以換取更高的編碼效率。摘壓縮主要有特徵抽取和量化兩種方法,指紋的模式識別是前者的典型例子,後者則是一種更通用的摘壓縮技術。
更加詳細的資料看這里吧。
http://www.kdntc.cn/nic/netstudy/wsjs/tongxin/shu/039.htm
-----------------------------
數據壓縮是通過減少計算機中所存儲數據或者通信傳播中數據的冗餘度,達到增大數據密度,最終使數據的存儲空間減少的技術。
數據壓縮在文件存儲和分布式系統領域有著十分廣泛的應用。數據壓縮也代表著尺寸媒介容量的增大和網路帶寬的擴展。
數據壓縮就是將字元串的一種表示方式轉換為另一種表示方式,新的表示方式包含相同的信息量,但是長度比原來的方式盡可能的短。
1. 數據壓縮與編碼
數據壓縮跟編碼技術聯系緊密,壓縮的實質就是根據數據的內在聯系將數據從一種編碼映射為另一種編碼。壓縮前的數據要被劃分為一個一個的基本單元。基本單元既可以是單個字元,也可以是多個字元組成的字元串。稱這些基本單元為源消息,所有的源消息構成源消息集。源消息集映射的結果為碼字集。可見,壓縮前的數據是源消息序列,壓縮後的數據是碼字序列。
若定義塊為固定長度的字元或字元串,可變長為長度可變的字元或字元串,則編碼可分為塊到塊編碼、塊到可變長編碼、可變長到塊編碼、可變長到可變長編碼等。應用最廣泛的ASCII編碼就是塊到塊編碼。
2. 數據壓縮的分類
數據壓縮按照映射是否固定可分為靜態數據壓縮和動態數據壓縮。靜態數據壓縮是指壓縮前源消息集到碼字集之間的映射是固定的,出現在被壓縮數據中的源消息每次都被映射為同一碼字。動態數據壓縮是指源消息集到碼字集的映射會隨著壓縮進度的變化而變化。靜態壓縮編碼需要兩步,先計算出源消息出現的頻率,確定源消息到碼字之間的映射;然後完成映射。動態數據壓縮則只需一步就能完成,它在壓縮過程中只對源消息集掃描一次。有些數據壓縮演算法是混合型的,綜合應用了靜態數據壓縮和動態數據壓縮技術。
3. 評價數據壓縮的標准
從實際應用來說,數據壓縮可從兩方面來衡量:數據壓縮速度和數據壓縮率。當數據壓縮應用於網路傳輸時,主要考慮速度快慢;當數據壓縮應用於數據存儲中,主要考慮壓縮率,即壓縮後數據的大小。當然這兩方面是相輔相成的。
常用的評價標准有冗餘度、平均源信息長度、壓縮率等。對於一種編碼方式是否為較好的編碼,主要看該編碼的冗餘度是否最小。
4. 常見的數據壓縮工具
現在操作簡單,使用方便,功能強大的數據壓縮工具有很多。最常見的是WinZip和WinRAR。
數據壓縮通過減少數據的冗餘度來減少數據在存儲介質上的存儲空間,而數據備份則通過增加數據的冗餘度來達到保護數據安全的目的。兩者在實際應用中常常結合起來使用。通常將要備份的數據進行壓縮處理,然後將壓縮後的數據用備份進行保護。當需要恢復數據時,先將備份數據恢復,再解壓縮。
由於計算機中的數據十分寶貴又比較脆弱,數據備份無論對國家、企業和個人來說都非常重要。數據備份能在較短的時間內用很小的代價,將有價值的數據存放到與初始創建的存儲位置相異的地方;當數據被破壞時,用較短的時間和較小的花費將數據全部恢復或部分恢復。
1. 對備份系統的要求
不同的應用環境有不同的備份需求,一般來說,備份系統應該有以下特性。
☆ 穩定性:備份系統本身要很穩定和可靠。
☆ 兼容性:備份系統要能支持各種操作系統、資料庫和典型應用軟體。
☆ 自動化:備份系統要有自動備份功能,並且要有日誌記錄。
☆ 高性能:備份的效率要高,速度要盡可能的快。
☆ 操作簡單:以適應不同層次的工作人員的要求,減輕工作人員負擔。
☆ 實時性:對於某些不能停機備份的數據,要可以實時備份,以確保數據正確。
☆ 容錯性:若有可能,最好有多個備份,確保數據安全可靠。
2. 數據備份的種類
數據備份按所備份數據的特點可分為完全備份、增量備份和系統備份。
完全備份是指對指定位置的所有數據都備份,它佔用較大的空間,備份過程的時間也較長。增量備份是指數據有變化時對變化的部分進行備份,它佔用空間小,時間短。完全備份一般在系統第一次使用時進行,而增量備份則經常進行。系統備份是指對整個系統進行備份。它一般定期進行,佔用空間較大,時間較長。
3. 數據備份的常用方法
數據備份根據使用的存儲介質種類可分為軟盤備份、磁帶備份、光碟備份、優盤備份、移動硬碟備份、本機多個硬碟備份和網路備份。用戶可以根據數據大小和存儲介質的大小是否匹配進行選擇。
數據備份是被動的保護數據的方法,用戶應根據不同的應用環境來選擇備份系統、備份設備和備份策略。
http://ke..com/view/286827.html
---------------------------
有損數據壓縮方法是經過壓縮、解壓的數據與原始數據不同但是非常接近的壓縮方法。有損數據壓縮又稱破壞型壓縮,即將次要的信息數據壓縮掉,犧牲一些質量來減少數據量,使壓縮比提高。這種方法經常用於網際網路尤其是流媒體以及電話領域。在這篇文章中經常成為編解碼。它是與無損數據壓縮對應的壓縮方法。根據各種格式設計的不同,有損數據壓縮都會有 generation loss:壓縮與解壓文件都會帶來漸進的質量下降。
[編輯] 有損壓縮的類型
有兩種基本的有損壓縮機制:
一種是有損變換編解碼,首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音采樣或者或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的信息進行量化與編碼。
有些系統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟產生的誤差信號。
有損與無損壓縮比較
有損方法的一個優點就是在有些情況下能夠獲得比任何已知無損方法小得多的文件大小,同時又能滿足系統的需要。
有損方法經常用於壓縮聲音、圖像以及視頻。有損視頻編解碼幾乎總能達到比音頻或者靜態圖像好得多的壓縮率(壓縮率是壓縮文件與未壓縮文件的比值)。音頻能夠在沒有察覺的質量下降情況下實現 10:1 的壓縮比,視頻能夠在稍微觀察質量下降的情況下實現如 300:1 這樣非常大的壓縮比。有損靜態圖像壓縮經常如音頻那樣能夠得到原始大小的 1/10,但是質量下降更加明顯,尤其是在仔細觀察的時候。
當用戶得到有損壓縮文件的時候,譬如為了節省下載時間,解壓文件與原始文件在數據位的層面上看可能會大相徑庭,但是對於多數實用目的來說,人耳或者人眼並不能分辨出二者之間的區別。
一些方法將人體解剖方面的特質考慮進去,例如人眼只能看到一定頻率的光線。心理聲學模型描述的是聲音如何能夠在不降低聲音感知質量的前提下實現最大的壓縮。
人眼或人耳能夠察覺的有損壓縮帶來的缺陷稱為壓縮失真(en:compression artifact)。
http://ke..com/view/583477.html
⑼ 腰椎第一節壓縮性骨折固定術後多久才能下
你好,腰椎壓縮性骨折術後卧床二至三個月,兩至三周後開始進行腰背肌功能鍛煉,術後一個月可以俯卧。 腰椎壓縮性骨折釘棒系統內固定術後一個月可以俯卧位(趴著),平卧位及側卧位,不能坐,不能站,兩至三個月後才能下地,術後在康復醫師指導下進行功能鍛煉,增加營養促進骨折癒合,促進恢復。