本文是针对 LZ4 Block Format Description 的部分内容的翻译和综述,解释了 LZ4 压缩算法的块数据的格式规定。
前言
LZ4 是使用了“固定的面向字节的编码格式”的一种 LZ77 类型的压缩算法。本文介绍的是块数据(Block)的格式规定,不涉及熵编码器(Entropy Encoder)和成帧层(Framing Layer),也不涉及压缩或解压算法的具体实现。
术语
- 序列(Sequence)是组成块的基本单位。
- 字面量(Literal)是未经过压缩的原始数据。
- 匹配复制(Match Copy)是将“先前出现过的字面量”的值复制到新位置的操作。
- 标志符(Token)是序列最开头的 1 Byte。
- 偏移量(Offset)是匹配复制操作中定位“先前出现过的字面量”的依据。
- 匹配长度(Match Length)是匹配复制操作中需要复制的字面量的长度。