文本压缩
Ⅰ 什么叫文本压缩,他的定义是什么
文本压缩(text compression) 是数据压缩(data compression) 的一个分支, 属于无损压缩(lossless compression) 。它的目标是通过对数据施加某种操作或变换使之长度变短的同时, 还必须保证原始数据能够从压缩产生的压缩码中得以精确的还原。主要的文本压缩编码有:Huffman 编码,算术编码,游程编码,LZ 编码,LZW编码等。
算法分类
文本压缩算法可以划分为统计方法和词典编码方法。
统计方法当以Huffman 编码( Huffman coding) 和算术编码(arithmetic coding) 为代表。这种方法需要统计信源符号的概率分布情况, 并根据统计结果产生压缩码。统计可以一次性完成(如静态Huffman 编码) , 也可以边编码边统计(如动态Huffman 编码) 。
更多的自己看网站吧
Ⅱ c语言 文本文件压缩
再发次,有80分呢哎
Ⅲ 请教文本文件压缩率
我认为rar不会识别文件的类型,所以任何文件都做文本处理
所以我们都看成文本
我做过测试,采用一般压缩和高级压缩,rar对文件的判断是不同的
采用一般压缩那么rar以每行压缩吧,一般在每行16字到32字之间的一个数作为阀值,具体多少我不清楚,反正每行16字和每行32字的压缩率不同,我甚至计算了除去rar的基本文件大小100字节,呵呵,对于大文件而言可以忽略
你上面我估算一下,两文件的平均每行字数为前者32~33字 后者 24-25字
这足够说明 你两个文件的每行字刚好处于我所谓的阀值左右两侧,所以一般压缩情况下rar采用了不同的分析方法,得到不同的压缩率
但是你如果采用最好压缩的话,得到的压缩率应该差不多的,我相信,因为我认为最好压缩可能不采用对行字数进行判断,而是把换行符号一起看成内容,综合压缩的
另,我发现每行字很少的采用最好压缩得到的压缩率反而比字多的高(就是值高,被压缩量少),也比同字数的一般压缩方式的文件更大(也是压缩率高,被压缩量少),说明换行在文件中占据的比率更高的缘故
我们都有点吃饱了撑着,研究这个。。。。。。O(∩_∩)O哈哈~
不过要是你是认真的一个事情,试试采用最好压缩方式吧,那是通常来说最高压缩(率值最小)的,而且最高压缩一般只和文件大小和文件流码关系(流码我理解为复杂度)
Ⅳ 如何将文本文档压缩成rar格式
将文本文档压缩成rar格式,可以使用winrar压缩软件压缩成rar格式。
方法步骤如下:
1、在浏览器中使用网络搜索“winrar”,点击“立即下载”,进行“winrar”安装包的下载。
Ⅳ 文本文档怎么压缩
用winrar压缩软件就行了啊。
好吧,既然你都这么客气,我就帮帮你吧。
1、首先,你要知道你的电脑上是否安装了压缩软件,若没有,找人给你安装一个winrar压缩软件吧,那个软件是免费的,不用花钱买;
2、鼠标右键点击你那个文本文档的图标,在弹出的菜单中,点击“添加到压缩文件”,它又会弹出另一个菜单,点击它里面的“确定”按钮,就搞定了!!