平均壓縮率

發布時間: 2022-09-18 14:29:31

① 照片8M是多大啊怎麼樣才能把相片弄到8M多啊

具體操作如下：

1、在照片沒有經過壓縮的情況下，270萬像素的照片尺寸約為8M，因為沒有這個規格，可以按300萬像素來說，照片尺寸為2048x1536，也就是說照片在寬度范圍內有2048個點，在高度范圍內有1536個點。

2、為了節約空間，一般照相機存儲照片時都進行了壓縮，壓縮率根據照片色彩情況是不一樣的，越簡單的照片壓縮率越高，平均壓縮率30%——50%，簡單按此計算，8M照片應該在600萬—800萬像素之間，如果背景簡單，可以超過1000萬像素。

3、可以利用photoshop軟體，人為提高照片像素，可以使照片尺寸變得很大，但是照片質量不會有任何提高。

注意：

照片的尺寸通常以英寸為單位，1英寸≈2.54厘米。X寸照片是指照片長的一邊為X寸（1寸照為短的一邊）。如5寸照片的長為2.54×5=12.7cm；12寸照片的長為2.54×12=30.5cm。

身份證、體檢表等多採用小一寸22mm×32mm，第二代身份證照片尺寸為26mm×32mm，普通一寸照則為25mm×35mm。中國護照/旅行證照片的尺寸為48mm×33mm，其中，頭部寬度為15mm～22mm，頭部長度為28mm～33mm。

② 壓縮率是什麼意思壓縮率是越高越好還是越低越好

描述壓縮文件的效果名，是文件壓縮後的大小與壓縮前的大小之比，例如：把100m的文件壓縮後是90m，壓縮率為90/100*100%=90%，壓縮率一般是越小越好，但是壓得越小，解壓時間越長。追問那壓縮率越小，是不是壓縮文件的時間也越短？大小也就越小？補充是的，你可以試一下

③ DVD的平均壓縮率比VCD的平均壓縮率要怎樣。 VCD使用的核心壓縮標準是什麼、急呀！！！！！！！！

國內的常規電視機是PAL制式，原始解析度為720x576，50Hz隔行掃描；歐美的常規電視機是NTSC制式，原始解析度為720x480，60Hz隔行掃描。一般情況下不用改源文件的解析度，一般的RMVB解析度都不是很高。

VCD是一種全動態、全屏播放的視頻標准。它的格式可分為：解析度為352x240像素，每秒29.97幅畫面（適合NTSC制式電視播放）解析度為352x240像素，每秒23.976幅畫面解析度為352x288像素，每秒25幅畫面（適合PAL制式電視播放）光碟
整體來說解析度大約是對應電視制式解析度的四分之一。VCD的視頻採用MPEG-1壓縮編碼，音頻採用MPEG 1/2 Layer 2(MP2)編碼。碼率分別為視頻1150kbit/s，音頻224kbit/s。整個視頻質量和VHS錄像帶相當。由於VCD的比特率和普通音樂CD相當，因此，一張標準的74分鍾的CD可以存放大約74分鍾的VCD格式的視頻。

④ clickhouse數據壓縮對比

Clickhouse 數據壓縮主要使用兩個方案LZ4和ZSTD
LZ4解壓縮速度上會更快，但壓縮率較低，
ZSTD解壓縮較慢。但是壓縮比例較高。
clickhouse不同壓縮演算法測試對比，LZ4最優。
https://www.percona.com/blog/2016/04/13/evaluating-database-compression-methods-update
以下測試主要驗證業內測試的結論，測試的zstd數據會多一點，測試不是十分嚴謹，僅供參考。

開發(dev) 機器數量：3 cpu：40core 內存：256G disk：2.0T*10

kafka TOPIC: cdn-log-analysis-realtime。可消費數據總量363255827。數據消費4次到ck。

cdn_log_analysis_realtime lz4壓縮
cdn_log_realtime zstd壓縮

在/etc/metrika.xml
<compression incl="clickhouse_compression"> --指定incl
<case>
<min_part_size>10000000000</min_part_size> --數據部分的最小大小
<min_part_size_ratio>0.01</min_part_size_ratio> --數據部分大小與表大小的比率
<method>zstd</method> --壓縮演算法，zstd和lz4
</case>
</compression>

執行sql ：SELECT table AS 表名 , sum(rows) AS 總行數 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 壓縮大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes))*100, 0) AS 壓縮率 FROM system.parts WHERE (database IN ('default') AND (table = 'cdn_log_analysis_realtime') ) GROUP BY table

分別查看不同機器的壓縮比例

平均 4.85億 數據，原始數據 105G 壓縮後數據 27G ，平均壓縮率 27% 。

執行sql : select toDateTime(intDiv(toUInt32(its),60)*60) as t, count() as t_c, avg(speed) as t_v, quantile(0.99)(speed) as t_99, quantile(0.90)(speed) as t_90 , quantile(0.75)(speed) as t_75 , quantile(0.50)(speed) as t_50 , quantile(0.25)(speed) as t_25 from default.cdn_log_analysis_realtime_all where day=񟭔-12-17' group by t order by t_v desc

冷數據（第一次查詢）

熱數據（第二次查詢）

執行sql ：
SELECT table AS 表名 , sum(rows) AS 總行數 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 壓縮大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes))*100, 0) AS 壓縮率 FROM system.parts WHERE (database IN ('default') AND (table = 'cdn_log_realtime') ) GROUP BY table

分別查看不同機器的壓縮比例

執行sql :select toDateTime(intDiv(toUInt32(its),60)*60) as t, count() as t_c, avg(speed) as t_v, quantile(0.99)(speed) as t_99, quantile(0.90)(speed) as t_90 , quantile(0.75)(speed) as t_75 , quantile(0.50)(speed) as t_50 , quantile(0.25)(speed) as t_25 from default.cdn_log_realtime where day=񟭔-12-25' group by t order by t_v desc

冷數據（第一次查詢）

熱數據（第二次查詢）

執行sql：SELECT 'ZSTD' as 壓縮方式 , table AS 表名 , sum(rows) AS 總行數 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 壓縮大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes)) 100, 0) AS 壓縮率 FROM cluster(ctyun31, system, parts) WHERE (database IN ('default') AND (table = 'cdn_log_realtime') ) GROUP BY table union all SELECT 'LZ4' as 壓縮方式 , table AS 表名 , sum(rows) AS 總行數 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 壓縮大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes)) 100, 0) AS 壓縮率 FROM cluster(ctyun31, system, parts) WHERE (database IN ('default') AND (table = 'cdn_log_analysis_realtime') ) GROUP BY table

測試不是十分嚴謹，ZSTD的ck表的數據多一點，但是不影響測試結果，僅做參考。
壓縮能力上，ZSTD的壓縮比例為 22% ，LZ4的壓縮比例為 27% ，ZSTD的壓縮性能更好。但是效果不是很明顯。
查詢能力上，冷數據查詢，兩者相差不大。熱數據方面，ZSTD為 3.884s ，而LZ4為 1.150s 。ZSTD查詢時間在 3.37倍 以上，LZ4的查詢能力更強。
綜上所述，建議使用LZ4。

集群數據量後期預估，按當前使用lz4壓縮方案，3分片1副本，計算3 5.5 10*0.8(按磁碟最多使用80%算) 的硬碟能存儲大概多少數據。

一天數據100億
一天磁碟消耗 (10000000000/1453023308.0 84.98)/1024.0=0.57TB
能存儲天數 3 5.5 10 0.8/0.57=231.57 day。

一天數據1000億
231.57/10=23.1day。

⑤ 哈夫曼編碼的壓縮率怎麼算

哈夫曼編碼壓縮率很低的
舉個例子：用三位二進行數進行的等長編碼平均長度為3，而根據哈夫曼樹編碼的平均碼長為：
4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61
2.61/3=0.87=87%
其平均碼長是等長碼的87%。
所以平均壓縮率為13%。
所以應該是你演算法有問題……

⑥ 哈夫曼編碼碼長怎麼算

設某信源產生有五種符號u1、u2、u3、u4和u5，對應概率P1=0.4，P2=0.1，P3=P4=0.2，P5=0.1。

霍夫曼編碼是變長編碼，思路：對概率大的編的碼字短，概率小的編的碼字長，這樣一來所編的總碼長就小，這樣編碼效率就高。上面那樣求是不對的，除非你這6個碼字是等概率的，各佔1/6。應該用對應的概率*其對應得碼長，再求和。

實際應用中

除採用定時清洗以消除誤差擴散和採用緩沖存儲以解決速率匹配以外，主要問題是解決小符號集合的統計匹配，例如黑（1）、白（0）傳真信源的統計匹配，採用0和1不同長度遊程組成擴大的符號集合信源。遊程，指相同碼元的長度（如二進碼中連續的一串0或一串1的長度或個數）。

按照CCITT標准，需要統計2×1728種遊程（長度），這樣，實現時的存儲量太大。事實上長遊程的概率很小，故CCITT還規定：若l表示遊程長度，則l=64q+r。

⑦ 照片8M是多大啊怎麼樣才能把相片弄到8M多啊

在PS中打開照片，並且用右鍵點擊圖片上面的藍色條（文件名，格式和顯示放大率），選擇圖像大小，在隨後的對話框中，最上面顯示文件的大小，例如1.98M，下面是寬度和高度尺寸，最下面是解析度一般默認是72像素/英寸，可以只改解析度進行調整，例如把原解析度改為200像素/英寸，可以看見像素大小就變成了15.3M了。

⑧ 哈夫曼編碼碼長怎麼算

假設用於通信的電文由字元集{a,b,c,d,e,f,g,h}中的字母構成，這8個字母在電文中出現的概率分別為{0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.10}。

哈夫曼編碼根據上面可得編碼表： a:1001 b:01 c:10111 d:1010 e:11 f:10110 g:00 h:1000

用三位二進行數進行的等長編碼平均長度為3，而根據哈夫曼樹編碼的平均碼長為：4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61 2.61/3=0.87=87%其平均碼長是等長碼的87%，所以平均壓縮率為13%。

因為定長編碼已經用相同的位數這個條件保證了任一個字元的編碼都不會成為其它編碼的前綴,所以這種情況只會出現在變長編碼當中，要想避免這種情況，

就必須用一個條件來制約定長編碼，這個條件就是要想成為壓縮編碼，變長編碼就必須是前綴編碼，所謂的前綴編碼就是任何一個字元的編碼都不能是另一個字元編碼的前綴。

(8)平均壓縮率擴展閱讀：

實際應用中，除採用定時清洗以消除誤差擴散和採用緩沖存儲以解決速率匹配以外，主要問題是解決小符號集合的統計匹配，

例如黑（1）、白（0）傳真信源的統計匹配，採用0和1不同長度遊程組成擴大的符號集合信源。遊程，指相同碼元的長度（如二進碼中連續的一串0或一串1的長度或個數）。按照CCITT標准，需要統計2×1728種遊程（長度），

這樣，實現時的存儲量太大。事實上長遊程的概率很小，故CCITT還規定：若l表示遊程長度，則l=64q+r。其中q稱主碼，r為基碼。編碼時，不小於64的遊程長度由主碼和基碼組成。而當l為64的整數倍時，只用主碼的代碼，已不存在基碼的代碼。

⑨ 如何計算Huffman編碼的編碼效率和壓縮比

赫夫曼編碼的具體方法：先按出現的概率大小排隊，把兩個最小的概率相加，作為新的概率和剩餘的概率重新排隊，再把最小的兩個概率相加，再重新排隊，直到最後變成1。每次相加時都將「0」和「1」賦與相加的兩個概率，讀出時由該符號開始一直走到最後的「1」，將路線上所遇到的「0」和「1」按最低位到最高位的順序排好，就是該符號的赫夫曼編碼。

例如a7從左至右，由U至U″″，其碼字為1000；

a6按路線將所遇到的「0」和「1」按最低位到最高位的順序排好，其碼字為1001…

用赫夫曼編碼所得的平均比特率為：Σ碼長×出現概率

上例為：0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit

可以算出本例的信源熵為2.61bit，二者已經是很接近了。

哈夫曼編碼進行壓縮的壓縮率是根據平均碼長來計算的，壓縮率比較低。例如：用三位二進行數進行的等長編碼平均長度為3，而根據哈夫曼樹編碼的平均碼長為：

4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61

2.61/3=0.87=87%

其平均碼長是等長碼的87%，所以平均壓縮率為13%。

(9)平均壓縮率擴展閱讀：

霍夫曼編碼的基本方法先對圖像數據掃描一遍，計算出各種像素出現的概率，按概率的大小指定不同長度的唯一碼字，由此得到一張該圖像的霍夫曼碼表。編碼後的圖像數據記錄的是每個像素的碼字，而碼字與實際像素值的對應關系記錄在碼表中。

赫夫曼編碼是可變字長編碼(VLC)的一種。 Huffman於1952年提出一種編碼方法，該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字，有時稱之為最佳編碼，一般就稱Huffman編碼。下面引證一個定理，該定理保證了按字元出現概率分配碼長，可使平均碼長最短。

⑩ 利用哈夫曼編碼進行壓縮壓縮率一般達到多少

閱讀全文

熱點內容

linux圖形系統發布：2024-10-10 18:45:40 瀏覽：802

農業溯源碼發布：2024-10-10 18:44:53 瀏覽：841

rec320是哪個安卓版本發布：2024-10-10 18:44:02 瀏覽：859

無腳本的藝人節目發布：2024-10-10 18:26:55 瀏覽：396

安卓手機如何變成大屏幕發布：2024-10-10 18:26:55 瀏覽：675

餐館許可證編號密碼是什麼發布：2024-10-10 18:17:52 瀏覽：270

我的世界網易電腦版怎麼玩手機伺服器發布：2024-10-10 18:06:16 瀏覽：29

客戶伺服器怎麼調查發布：2024-10-10 17:56:05 瀏覽：36

軟體反編譯教程發布：2024-10-10 17:50:14 瀏覽：13

uc瀏覽器android 發布：2024-10-10 17:50:13 瀏覽：17

平均壓縮率

與平均壓縮率相關的資訊