十個字母無壓縮

發布時間: 2025-02-07 23:54:51

Ⅰ 壓縮的重復壓縮

有兩種形式的重復存在於計算機數據中，zip就是對這兩種重復進行了壓縮。
第一種
一種是短語形式的重復，即三個位元組以上的重復，對於這種重復，zip用兩個數字：1.重復位置距當前壓縮位置的距離；2.重復的長度，來表示這個重復，假設這兩個數字各佔一個位元組，於是數據便得到了壓縮，這很容易理解。
一個位元組有 0 - 255 共 256 種可能的取值，三個位元組有 256 * 256 * 256 共一千六百多萬種可能的情況，更長的短語取值的可能情況以指數方式增長，出現重復的概率似乎極低，實則不然，各種類型的數據都有出現重復的傾向，一篇論文中，為數不多的術語傾向於重復出現；一篇小說，人名和地名會重復出現；一張上下漸變的背景圖片，水平方向上的像素會重復出現；程序的源文件中，語法關鍵字會重復出現（我們寫程序時，多少次前後、paste？），以幾十 K 為單位的非壓縮格式的數據中，傾向於大量出現短語式的重復。經過上面提到的方式進行壓縮後，短語式重復的傾向被完全破壞，所以在壓縮的結果上進行第二次短語式壓縮一般是沒有效果的。
第二種
第二種重復為單位元組的重復，一個位元組只有256種可能的取值，所以這種重復是必然的。其中，某些位元組出現次數可能較多，另一些則較少，在統計上有分布不均勻的傾向，這是容易理解的，比如一個 ASCII 文本文件中，某些符號可能很少用到，而字母和數字則使用較多，各字母的使用頻率也是不一樣的，據說字母 e 的使用概率最高；許多圖片呈現深色調或淺色調，深色（或淺色）的像素使用較多（這里順便提一下：png圖片格式是一種無損壓縮，其核心演算法就是 zip 演算法，它和 zip 格式的文件的主要區別在於：作為一種圖片格式，它在文件頭處存放了圖片的大小、使用的顏色數等信息）；上面提到的短語式壓縮的結果也有這種傾向：重復傾向於出現在離當前壓縮位置較近的地方，重復長度傾向於比較短（20位元組以內）。這樣，就有了壓縮的可能：給 256 種位元組取值重新編碼，使出現較多的位元組使用較短的編碼，出現較少的位元組使用較長的編碼，這樣一來，變短的位元組相對於變長的位元組更多，文件的總長度就會減少，並且，位元組使用比例越不均勻，壓縮比例就越大。

Ⅱ 求十個字母TXT百度雲，不是壓縮包最好。跪求

不好意思找不到。😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬

閱讀全文

熱點內容

md5加密是對稱加密嗎發布：2025-04-22 21:51:31 瀏覽：655

高德地圖車機版要安卓什麼版發布：2025-04-22 21:41:20 瀏覽：196

一鍵ftp伺服器搭建腳本發布：2025-04-22 21:36:28 瀏覽：87

g代碼編譯器發布：2025-04-22 20:25:20 瀏覽：275

段式編譯器發布：2025-04-22 20:15:45 瀏覽：205

android原版發布：2025-04-22 20:15:04 瀏覽：78

特種兵一個組怎麼配置發布：2025-04-22 20:01:15 瀏覽：734

oracle資料庫命令發布：2025-04-22 19:47:55 瀏覽：564

python異或運算符發布：2025-04-22 19:45:21 瀏覽：832

網路為什麼改不了伺服器發布：2025-04-22 19:44:38 瀏覽：535

十個字母無壓縮

與十個字母無壓縮相關的資訊