Linear Error-Correcting Codes

Lizheng Wang

2024-07-01 (Updated: 2024-08-13)

我们希望通过通道可靠地将消息（以位表示）传输到目的地。传输过程中可能会出现错误，我们希望检测和纠正这些传输错误。为了做到这一点，我们必须在传输的消息中引入一些冗余。
我们看到Shannon’s Noisy Coding Theorem告诉我们，如果冗余度高于一定水平（受通道噪音约束），那么我们可以随着块长度的增加将错误概率（检测到发送的错误消息）减少到零。
该证明是基于随机编码，这不是很实用。为了易于编码和解码，我们的编码/解码功能需要优良的结构。我们将研究一类称为线性分组码的代码，因为它们的结构提供了几个优点。线性性将使我们更容易地分析代码的错误纠正能力。此外，使用矩阵来编码/解码消息比随机码本容易得多，并且可以简洁地描述代码。

两个概念：

Error detection：编码可以检测错误，但我们不知道错误在接收序列中的位置。
Error correction：我们知道错误在哪里，并且可以纠正错误的位位置。

在代码最多可以纠正t个错误的情况下，如果序列包含超过t个错误，解码器可能会解码到错误的信息序列。

任意两个比特串之间的汉明距离$d_H$是2个字符串不同的比特数。例如，码字$c_1=(101101)$和$c_2=(100110)$之间的汉明距离$d_H$是3。表示$d^*$是代码$C$的任何两个不同码字之间的最小汉明距离

$D^*=d_{\min }=\min _{c_i \neq c_j} d_H\left(c_i, c_j\right)$

码字之间最小距离为$d^*$的代码可以检测$d^*-1$错误，并可以纠正$\frac{d^*-1}{2}$错误。因此，要纠正一个错误，代码的最小距离必须至少为3。

线性码意味着$c\left(m+m^{\prime}\right)=c(m)+c\left(m^{\prime}\right)$，因此有 $c(01101)=c(01000)+c(00100)+c(00001)=c\left(e_2\right)+c\left(e_3\right)+c\left(e_5\right)$
$e_i, 1 \leq i \leq k$构成了消息空间的基础，$e_i$的码字完全描述了线性码。因此，不需要带有$2^k$条目的代码本。我们仅需要一个矩阵即可

我们可以假设生成矩阵$G$采取特定形式。事实上，如果我们在$G$上执行基本行操作（在$Z_2$上，这意味着我们将一行添加到另一行），我们不会更改代码中的码字集合。我们甚至可以在不从根本上改变代码属性的情况下对列进行排列。因此，使用高斯消除，我们可以假设$G$采取更简单的形式：

$G=\left[I_{k \times k} S\right]，$

其中$S$是$k \times(n-k)$。

假设我们的矩阵$G$生成单纠错代码，因此没有权重1或2的码字，$G$的奇偶校验部分$S$必须满足以下2个条件：

$S$中每行的权重必须至少为2，因为$I$部分的每一行正好有一个权重。
没有两行$S$是相同的。否则，将这两行相加将给出一个权重2的码字。

汉明编码是单个纠错线性块代码，具有$(n, k)=\left(2^m-1,2^m-1-m\right)$，其中$m=n-k$是代码中的检查位数。最简单的非平凡代码是$m=3$，即$(7,4)$ Hamming代码。

之所以$k=2^m-1-m$

 $2^m$减去汉明重量为0和1的码字

我们知道如何用任何线性代码进行编码。由消息$m$生成的码字只是$c=m G$。但是解码怎么样？如果没有引入错误，第一个$k$位构成消息。但可能已经引入了错误。当只有一个错误时，正如我们现在所显示的那样，解码很容易。

对于每个生成器矩阵$G=[I S]$，都有一个奇偶校验矩阵$H$定义

$H=\left[\begin{array}{l}S \\ I\end{array}\right]$

由于$S$的大小为$k \times(n-k)$，我们的单位矩阵大小为$(n-k) \times(n-k)$，$H$的大小为$n \times(n-k)$。重要的观察是$G H=S+S=0$，因此$c=m G$满足$c H=m G H=0$。这意味着，如果有错误，并且我们收到了$\tilde{c}=c+e_i$，我们可以通过计算$\tilde{c} H$找到错误$e_i$，因为这应该是$c H+e_i H=e_i H$。因此，$\tilde{c} H$必须是$H$的行之一，该行的索引指示哪个位已损坏。一旦我们知道哪个位已损坏，我们就可以恢复消息。