平均压缩率

发布时间: 2022-09-18 14:29:31

① 照片8M是多大啊怎么样才能把相片弄到8M多啊

具体操作如下：

1、在照片没有经过压缩的情况下，270万像素的照片尺寸约为8M，因为没有这个规格，可以按300万像素来说，照片尺寸为2048x1536，也就是说照片在宽度范围内有2048个点，在高度范围内有1536个点。

2、为了节约空间，一般照相机存储照片时都进行了压缩，压缩率根据照片色彩情况是不一样的，越简单的照片压缩率越高，平均压缩率30%——50%，简单按此计算，8M照片应该在600万—800万像素之间，如果背景简单，可以超过1000万像素。

3、可以利用photoshop软件，人为提高照片像素，可以使照片尺寸变得很大，但是照片质量不会有任何提高。

注意：

照片的尺寸通常以英寸为单位，1英寸≈2.54厘米。X寸照片是指照片长的一边为X寸（1寸照为短的一边）。如5寸照片的长为2.54×5=12.7cm；12寸照片的长为2.54×12=30.5cm。

身份证、体检表等多采用小一寸22mm×32mm，第二代身份证照片尺寸为26mm×32mm，普通一寸照则为25mm×35mm。中国护照/旅行证照片的尺寸为48mm×33mm，其中，头部宽度为15mm～22mm，头部长度为28mm～33mm。

② 压缩率是什么意思压缩率是越高越好还是越低越好

描述压缩文件的效果名，是文件压缩后的大小与压缩前的大小之比，例如：把100m的文件压缩后是90m，压缩率为90/100*100%=90%，压缩率一般是越小越好，但是压得越小，解压时间越长。追问那压缩率越小，是不是压缩文件的时间也越短？大小也就越小？补充是的，你可以试一下

③ DVD的平均压缩率比VCD的平均压缩率要怎样。 VCD使用的核心压缩标准是什么、急呀！！！！！！！！

国内的常规电视机是PAL制式，原始分辨率为720x576，50Hz隔行扫描；欧美的常规电视机是NTSC制式，原始分辨率为720x480，60Hz隔行扫描。一般情况下不用改源文件的分辨率，一般的RMVB分辨率都不是很高。

VCD是一种全动态、全屏播放的视频标准。它的格式可分为：分辨率为352x240像素，每秒29.97幅画面（适合NTSC制式电视播放）分辨率为352x240像素，每秒23.976幅画面分辨率为352x288像素，每秒25幅画面（适合PAL制式电视播放）光盘
整体来说分辨率大约是对应电视制式分辨率的四分之一。VCD的视频采用MPEG-1压缩编码，音频采用MPEG 1/2 Layer 2(MP2)编码。码率分别为视频1150kbit/s，音频224kbit/s。整个视频质量和VHS录像带相当。由于VCD的比特率和普通音乐CD相当，因此，一张标准的74分钟的CD可以存放大约74分钟的VCD格式的视频。

④ clickhouse数据压缩对比

Clickhouse 数据压缩主要使用两个方案LZ4和ZSTD
LZ4解压缩速度上会更快，但压缩率较低，
ZSTD解压缩较慢。但是压缩比例较高。
clickhouse不同压缩算法测试对比，LZ4最优。
https://www.percona.com/blog/2016/04/13/evaluating-database-compression-methods-update
以下测试主要验证业内测试的结论，测试的zstd数据会多一点，测试不是十分严谨，仅供参考。

开发(dev) 机器数量：3 cpu：40core 内存：256G disk：2.0T*10

kafka TOPIC: cdn-log-analysis-realtime。可消费数据总量363255827。数据消费4次到ck。

cdn_log_analysis_realtime lz4压缩
cdn_log_realtime zstd压缩

在/etc/metrika.xml
<compression incl="clickhouse_compression"> --指定incl
<case>
<min_part_size>10000000000</min_part_size> --数据部分的最小大小
<min_part_size_ratio>0.01</min_part_size_ratio> --数据部分大小与表大小的比率
<method>zstd</method> --压缩算法，zstd和lz4
</case>
</compression>

执行sql ：SELECT table AS 表名 , sum(rows) AS 总行数 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 压缩大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes))*100, 0) AS 压缩率 FROM system.parts WHERE (database IN ('default') AND (table = 'cdn_log_analysis_realtime') ) GROUP BY table

分别查看不同机器的压缩比例

平均 4.85亿 数据，原始数据 105G 压缩后数据 27G ，平均压缩率 27% 。

执行sql : select toDateTime(intDiv(toUInt32(its),60)*60) as t, count() as t_c, avg(speed) as t_v, quantile(0.99)(speed) as t_99, quantile(0.90)(speed) as t_90 , quantile(0.75)(speed) as t_75 , quantile(0.50)(speed) as t_50 , quantile(0.25)(speed) as t_25 from default.cdn_log_analysis_realtime_all where day=񟭔-12-17' group by t order by t_v desc

冷数据（第一次查询）

热数据（第二次查询）

执行sql ：
SELECT table AS 表名 , sum(rows) AS 总行数 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 压缩大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes))*100, 0) AS 压缩率 FROM system.parts WHERE (database IN ('default') AND (table = 'cdn_log_realtime') ) GROUP BY table

分别查看不同机器的压缩比例

执行sql :select toDateTime(intDiv(toUInt32(its),60)*60) as t, count() as t_c, avg(speed) as t_v, quantile(0.99)(speed) as t_99, quantile(0.90)(speed) as t_90 , quantile(0.75)(speed) as t_75 , quantile(0.50)(speed) as t_50 , quantile(0.25)(speed) as t_25 from default.cdn_log_realtime where day=񟭔-12-25' group by t order by t_v desc

冷数据（第一次查询）

热数据（第二次查询）

执行sql：SELECT 'ZSTD' as 压缩方式 , table AS 表名 , sum(rows) AS 总行数 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 压缩大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes)) 100, 0) AS 压缩率 FROM cluster(ctyun31, system, parts) WHERE (database IN ('default') AND (table = 'cdn_log_realtime') ) GROUP BY table union all SELECT 'LZ4' as 压缩方式 , table AS 表名 , sum(rows) AS 总行数 , formatReadableSize(sum(data_uncompressed_bytes)) AS 原始大小 , formatReadableSize(sum(data_compressed_bytes)) AS 压缩大小 , round((sum(data_compressed_bytes)/sum(data_uncompressed_bytes)) 100, 0) AS 压缩率 FROM cluster(ctyun31, system, parts) WHERE (database IN ('default') AND (table = 'cdn_log_analysis_realtime') ) GROUP BY table

测试不是十分严谨，ZSTD的ck表的数据多一点，但是不影响测试结果，仅做参考。
压缩能力上，ZSTD的压缩比例为 22% ，LZ4的压缩比例为 27% ，ZSTD的压缩性能更好。但是效果不是很明显。
查询能力上，冷数据查询，两者相差不大。热数据方面，ZSTD为 3.884s ，而LZ4为 1.150s 。ZSTD查询时间在 3.37倍 以上，LZ4的查询能力更强。
综上所述，建议使用LZ4。

集群数据量后期预估，按当前使用lz4压缩方案，3分片1副本，计算3 5.5 10*0.8(按磁盘最多使用80%算) 的硬盘能存储大概多少数据。

一天数据100亿
一天磁盘消耗 (10000000000/1453023308.0 84.98)/1024.0=0.57TB
能存储天数 3 5.5 10 0.8/0.57=231.57 day。

一天数据1000亿
231.57/10=23.1day。

⑤ 哈夫曼编码的压缩率怎么算

哈夫曼编码压缩率很低的
举个例子：用三位二进行数进行的等长编码平均长度为3，而根据哈夫曼树编码的平均码长为：
4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61
2.61/3=0.87=87%
其平均码长是等长码的87%。
所以平均压缩率为13%。
所以应该是你算法有问题……

⑥ 哈夫曼编码码长怎么算

设某信源产生有五种符号u1、u2、u3、u4和u5，对应概率P1=0.4，P2=0.1，P3=P4=0.2，P5=0.1。

霍夫曼编码是变长编码，思路：对概率大的编的码字短，概率小的编的码字长，这样一来所编的总码长就小，这样编码效率就高。上面那样求是不对的，除非你这6个码字是等概率的，各占1/6。应该用对应的概率*其对应得码长，再求和。

实际应用中

除采用定时清洗以消除误差扩散和采用缓冲存储以解决速率匹配以外，主要问题是解决小符号集合的统计匹配，例如黑（1）、白（0）传真信源的统计匹配，采用0和1不同长度游程组成扩大的符号集合信源。游程，指相同码元的长度（如二进码中连续的一串0或一串1的长度或个数）。

按照CCITT标准，需要统计2×1728种游程（长度），这样，实现时的存储量太大。事实上长游程的概率很小，故CCITT还规定：若l表示游程长度，则l=64q+r。

⑦ 照片8M是多大啊怎么样才能把相片弄到8M多啊

在PS中打开照片，并且用右键点击图片上面的蓝色条（文件名，格式和显示放大率），选择图像大小，在随后的对话框中，最上面显示文件的大小，例如1.98M，下面是宽度和高度尺寸，最下面是分辨率一般默认是72像素/英寸，可以只改分辨率进行调整，例如把原分辨率改为200像素/英寸，可以看见像素大小就变成了15.3M了。

⑧ 哈夫曼编码码长怎么算

假设用于通信的电文由字符集{a,b,c,d,e,f,g,h}中的字母构成，这8个字母在电文中出现的概率分别为{0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.10}。

哈夫曼编码根据上面可得编码表： a:1001 b:01 c:10111 d:1010 e:11 f:10110 g:00 h:1000

用三位二进行数进行的等长编码平均长度为3，而根据哈夫曼树编码的平均码长为：4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61 2.61/3=0.87=87%其平均码长是等长码的87%，所以平均压缩率为13%。

因为定长编码已经用相同的位数这个条件保证了任一个字符的编码都不会成为其它编码的前缀,所以这种情况只会出现在变长编码当中，要想避免这种情况，

就必须用一个条件来制约定长编码，这个条件就是要想成为压缩编码，变长编码就必须是前缀编码，所谓的前缀编码就是任何一个字符的编码都不能是另一个字符编码的前缀。

(8)平均压缩率扩展阅读：

实际应用中，除采用定时清洗以消除误差扩散和采用缓冲存储以解决速率匹配以外，主要问题是解决小符号集合的统计匹配，

例如黑（1）、白（0）传真信源的统计匹配，采用0和1不同长度游程组成扩大的符号集合信源。游程，指相同码元的长度（如二进码中连续的一串0或一串1的长度或个数）。按照CCITT标准，需要统计2×1728种游程（长度），

这样，实现时的存储量太大。事实上长游程的概率很小，故CCITT还规定：若l表示游程长度，则l=64q+r。其中q称主码，r为基码。编码时，不小于64的游程长度由主码和基码组成。而当l为64的整数倍时，只用主码的代码，已不存在基码的代码。

⑨ 如何计算Huffman编码的编码效率和压缩比

赫夫曼编码的具体方法：先按出现的概率大小排队，把两个最小的概率相加，作为新的概率和剩余的概率重新排队，再把最小的两个概率相加，再重新排队，直到最后变成1。每次相加时都将“0”和“1”赋与相加的两个概率，读出时由该符号开始一直走到最后的“1”，将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好，就是该符号的赫夫曼编码。

例如a7从左至右，由U至U″″，其码字为1000；

a6按路线将所遇到的“0”和“1”按最低位到最高位的顺序排好，其码字为1001…

用赫夫曼编码所得的平均比特率为：Σ码长×出现概率

上例为：0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit

可以算出本例的信源熵为2.61bit，二者已经是很接近了。

哈夫曼编码进行压缩的压缩率是根据平均码长来计算的，压缩率比较低。例如：用三位二进行数进行的等长编码平均长度为3，而根据哈夫曼树编码的平均码长为：

4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61

2.61/3=0.87=87%

其平均码长是等长码的87%，所以平均压缩率为13%。

(9)平均压缩率扩展阅读：

霍夫曼编码的基本方法先对图像数据扫描一遍，计算出各种像素出现的概率，按概率的大小指定不同长度的唯一码字，由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字，而码字与实际像素值的对应关系记录在码表中。

赫夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就称Huffman编码。下面引证一个定理，该定理保证了按字符出现概率分配码长，可使平均码长最短。

⑩ 利用哈夫曼编码进行压缩压缩率一般达到多少

阅读全文

热点内容

餐馆许可证编号密码是什么发布：2024-10-10 18:17:52 浏览：269

我的世界网易电脑版怎么玩手机服务器发布：2024-10-10 18:06:16 浏览：28

客户服务器怎么调查发布：2024-10-10 17:56:05 浏览：35

软件反编译教程发布：2024-10-10 17:50:14 浏览：12

uc浏览器android 发布：2024-10-10 17:50:13 浏览：16

字母大小写编程发布：2024-10-10 17:25:40 浏览：632

安卓大陆用户怎么玩传说对决发布：2024-10-10 17:11:56 浏览：432

上传照片登录发布：2024-10-10 17:00:27 浏览：829

用友nc服务器的ip地址是什么发布：2024-10-10 17:00:27 浏览：293

云服务器双线发布：2024-10-10 16:52:18 浏览：164

平均压缩率

与平均压缩率相关的资讯