bz2的压缩效率

Bzip2比传统的gzip或zip具有更高的压缩效率,但压缩速度较慢。在这方面,它与其他一些压缩算法非常相似。与RAR或ZIP不同,bzip2只是一个数据压缩工具,而不是归档工具,这一点与gzip相似。该程序本身不包含多文件、加密或文件分割工具。而是根据UNIX的传统需求,使用tar或GnuPG等外部工具。

在某些情况下,bzip2在绝对压缩效率方面不如7z和RAR格式。根据摩尔定律的持续效应,计算时间越来越不重要,所以类似的压缩方式越来越流行。根据作者的说法,在所有已知的压缩算法中,bzip2可以排在最好的算法(PPM)之列,从10%到15%不等,尽管它在压缩速度上大约快2倍,在解压缩速度上快6倍。

Bzip2使用Burrows-Wheeler变换将重复的字符序列转换成字母相同的字符串,然后使用move-to-front变换进行处理,最后使用Huffman编码进行压缩。在bzip2中,所有的数据块都是大小相同的纯文本数据块。它们可以通过命令行变量选择,然后通过从π的十进制表示中获得的任意位序列识别为压缩文本。

最初bzip2的上一代bzip在数据块排列后,采用算术编码进行压缩。由于软件专利的限制,算术编码已经不再使用。