缩略图
Primary Education

一种将残差网络作为解映射器的LDPC 码译码模型

作者

朱帅龙 张丽君*青海大学

青海省西宁市 810016

引言

信道编码是现代通信系统中不可或缺的核心技术之一,其主要目的是通过特定的编码方式提高数据传输的可靠性和抗干扰能力,从而确保信息在复杂的通信环境中能够准确、高效地传输。LDPC 码是一种高效的线性分组纠错码,被广泛应用于现代通信系统。

BP(Belief Propagation)算法是 LDPC 码解码的主要方法之一,它是一种概率迭代算法,通过在 LDPC 码的 Tanner 图中添加可变节点和校验点,在图中的可变节点和校验节点之间交换概率信息,从而实现对 LDPC 码的解码。 然而,BP 解码算法存在计算量大、计算复杂的缺点。此外,随着 LDPC 代码长度的增加,需要执行的迭代次数也会增加,这进一步增加了计算量和复杂度。有很多研究人员提出了BP 算法的改进算法,有效简化了 BP 算法的计算复杂度和计算量。我们的研究目标是在保持较低计算复杂度和计算量的同时,实现与 BP算法相当的解码结果。为此,我们采用了 Min-Sum 和 Boxplus-Phi 两种改进算法作为解码策略,这显著减少了模型的计算量。

Min-Sum 算法和 Boxplus-phi 算法通过简化计算过程来减少对复杂函数的依赖。Min-Sum 算法通过用最小化运算取代乘除运算来降低计算复杂度。Boxplus-Phi 算法进一步优化了数值稳定性,使该算法在硬件实现方面更加高效。在本研究中,我们开发了一种名为 RN-Demapper _boxplus-phi 的创新 LDPC 解码模型,它巧妙地将残差神经网络技术与简化版 BP 算法相结合。通过这种结合,我们不仅保持了LDPC 解码的高效性能,还大大降低了计算复杂度。具体来说,RN-Demapper _boxplus-phi 模型利用神经网络作为解映射器,与简化的BP 算法协同工作,在不牺牲解码效果的前提下实现了计算资源的高效优化。

初始残差网络解映射器

本文提出的 RN-Demapper 是一种基于深度学习的信号解映射模型。该模型通过结合神经网络和残差连接,实现了对接收信号的高效解映射。RN-Demapper 的架构旨在从接收信号中提取特征并完成符号到比特的解映射任务,同时通过残差连接增强了模型的训练稳定性和特征表达能力。模型的整体架构由四层组成,具体描述如图1 所示:

输入包括接收的复数信号 Δy 和噪声方差 no 。首先,将噪声方差转换为对数尺度( logl0(no) ),并将其与接收信号的实部和虚部进行拼接,形成一个三维张量 z 。这一步骤将复数信号和噪声信息统一为模型可处理的实数形式。

第一层是一个全连接层,包含 256 个神经元,使用 ReLU 作为激活函数。该层的主要作用是对输入信号进行初步特征提取,并将其映射到高维空间,为后续处理提供丰富的特征表示。

第二层是一个全连接层,包含 128 个神经元,使用 ReLU 作为激活函数。该层的作用是对第一层输出的特征进行进一步映射和降维,提取更高层次的抽象特征。

为了增强模型的训练稳定性和特征表达能力,模型引入了残差连接。具体来说,输入张量 z 经过一个单独的全连接层处理,生成残差特征。然后将残差特征与第二层的输出相加,形成最终的加权特征表示。这种设计允许模型在训练过程中更好地保留低级特征,同时学习高级特征。

输出层是一个全连接层,包含 6 个神经元(对应于调制方案中每个符号所携带的比特数),未使用激活函数。该层的输出为每个符号的比特对数似然比。

本模型通过引入残差连接,能够更有效地保留低级特征并同时学习高级特征,显著提升了模型的训练稳定性和表达能力。多层次特征提取机制通过多层全连接层逐步提取信号的层次化特征,进一步增强了模型的表达能力。

此外,该模型结构简洁,具有较高的计算效率。其设计还具备良好的可扩展性,可以灵活地应用于其他高阶调制方案或更复杂的信道场景。

图1  初始残差网络图

残差网络的具体训练和测试流程图如图2 图3 所示。

图2  初始残差网络训练流程图

图3  初始残差网络测试流程图

简化残差网络解映射器

简化模型 SRN-Demapper 在初始模型 RN-Demapper 的基础上进行了多项优化。首先,通过减少层数,去掉了初始模型中的第二层全连接层,显著降低了参数量和计算开销。其次,将第一层和残差连接层的神经元数量从 256 减少到 128,进一步压缩了模型规模。这些优化使模型结构更加紧凑,同时保留了初始模型对全局依赖关系的建模能力和高效解映射的性能。 简化后的模型结构如图4 所示:

第一层是一个全连接层,包含 128 个神经元,使用 ReLU 作为激活函数。该层的主要作用是对输入信号进行初步特征提取,并将其映射到高维空间,为后续处理提供丰富的特征表示。

为了增强模型的训练稳定性和特征表达能力,模型引入了残差连接。具体来说,输入张量 z 经过一个单独的全连接层处理,生成残差特征。如果残差特征的维度与第一层输出的维度不匹配,则通过一个额外的全连接层将残差特征的维度调整为与第一层输出一致。然后将残差特征与第一层的输出相加,形成最终的加权特征表示。

输出层是一个全连接层,包含 6 个神经元,未使用激活函数。该层的输出为每个符号的比特对数似然比。

图4  简化残差网络图

实验设置

数据集与评估指标

为了全面评估所提出算法的性能,本实验设计了多种实验场景,涵盖了不同的码长和信噪比范围。实验中使用了三种不同的码长,分别为 n=300 、 n=600 和 ,以验证算法在不同码长下的鲁棒性和可扩展性;信噪比的范围设置为 4.0~7.5dB ,步长为 0.5dB ,以覆盖从较低到中等信噪比的典型通信场景。在每个信噪比点上进行了10,000 次独立的蒙特卡洛模拟实验,以确保实验结果的统计显著性。

为了提高实验效率,实验设定了提前终止条件:如果在一个信噪比点上的 10,000 次模拟中未出现任何错误,或者在一个信噪比点上出现了  3,000 个及以上的块错误,则终止该信噪比点的实验,并进入下一个信噪比点的实验。

评估算法性能的关键指标包括比特错误率 ,用于衡量接收端解调后比特错误的比例;块错误率 ,用于衡量接收端解调后整个码块错误的比例;以及运行时长 ,用于评估算法在实际运行中的计算效率。

本文的实验使用Sionna 来构建和训练模型,并进行整个仿真实验。

为了验证所提出算法的有效性,本章节对比了多种基于不同架构的解映射器组合,具体包括以下四类:

(1)残差网络组合:

Baseline:使用后验概率解映射和 Minsum 解码的 LDPC 编码作为基线。

Minsum+RN-demapper:基于 Minsum 算法的译码器与残差网络解映射器的组合。

Boxplus-phi:一种将后验概率解映射与 boxplus-phi 算法相结合的解码方法。

Boxplus-phi+RN-demapper:基于 Boxplus-phi 算法的译码器与残差网络解映射器的组合。

(2)简化残差网络组合:

Baseline:使用后验概率解映射和 Minsum 解码的 LDPC 编码作为基线。

Minsum+SRN-demapper:基于 Minsum 算法的译码器与简化残差网络解映射器的组合。

Boxplus-phi:一种将后验概率解映射与 Boxplus-phi 算法相结合的解码方法。

Boxplus-phi+SRN-demapper:基于 Boxplus-phi 算法的译码器与简化残差网络解映射器的组合。

结果与分析

性能对比

表 1 展示了在信噪比 7.5dB 、码长 以及  10,000 次蒙特卡洛模拟的实验条件下,不同模型的性能对比结果,包括块错误率 、比特错误率 和运行时间 。

表1  信噪比 =7.5dB , 码长 n=1200,10000 次蒙特卡洛模拟结果对照表

根据表 1 的实验结果,在信噪比 7.5dB、码长 1200 的条件下,各译码模型展现出显著的性能差异。从整体来看,RN_Boxplus-phi 模型表现最为突出,较基准 Baseline 模型实现了数量级的性能提升。值得注意的是,所有采用 Boxplus-phi 算法的模型均显著优于对应的Minsum 算法版本,其中 SRN_Boxplus-phi 模型在保持接近 Baseline 运行时间的同时,其 BLER 较 Baseline 降低了近 20 倍,BER 改善约 35 倍,展现出优异的性价比。相比之下,完整残差网络结构的 RN 系列模型虽然获得最佳译码性能,但计算耗时显著增加,而简化残差网络结构则成功地将运行时间控制在 500 秒以内。特别值得关注的是,SRN_Boxplus-phi 模型在性能与效率之间取得了理想的平衡,其BLER 性能达到完整 RN 结构的 77% ,而运行时间仅为后者的 63% 。实验结果充分验证了神经网络与传统译码算法结合的优越性。

表 2 展示了在信噪比 7.5dB 、码长 n=600 以及 10,000 次蒙特卡洛模拟的实验条件下,不同模型的性能对比结果,包括块错误率 、比特错误率和运行时。

表 2 信噪比 Γ=7.5dB , 码长 n=600,10000 次蒙特卡洛模拟结果对照表

表 2 的实验结果展现了不同译码模型的性能对比。总体来看,SRN_Boxplus-phi 模型在性能与效率的平衡上表现最为突出,较基准Baseline 模型分别提升了 42 倍和 108 倍,同时运行时间显著低于完整残差网络结构的 RN_Boxplus-phi 模型。值得注意的是,Boxplus-phi算法版本普遍优于对应的 Minsum 算法实现,其中 SRN_Boxplus-phi较 SRN_Minsum 的 BLER 降低了 81% ,BER 降低了 88% ,而运行时间仅增加 6.3% 。与码长 1200 的实验结果相比,所有模型在码长 600 时均表现出更高的 BLER 和 BER 值,但相对性能趋势保持一致,进一步验证了SRN 结构在保持性能优势的同时有效控制计算开销的特点。

表 3 展示了在信噪比 7.5dB 、码长 1=300 以及 10,000 次蒙特卡洛模拟的实验条件下,不同模型的性能对比结果。

表3 信噪比 Γ=7.5dB , 码长 n=300,10000 次蒙特卡洛模拟结果对照

在信噪比 7.5dB 、码长 300 的条件下,表 3 的实验结果由于触发了提前终止条件,各模型的运行时间显著缩短。从数据表现来看,SRN_Minsum 模型展现出最快的终止速度(28.3 秒),这与其相对较高的 BLER(1.6125e-02)直接相关。值得注意的是,虽然 SRN_Boxplus-phi 模型的运行时间(104.1 秒)因提前终止机制而大幅短于长码测试时的表现,但其仍保持最优的纠错性能,BLER(5.2141e-03)较基准模型提升 8.8 倍。实验数据揭示了一个重要现象:在短码条件下,提前终止机制使得高误码率的模型(如 SRN_Minsum)能够更快完成测试,其 28.3 秒的运行时间甚至短于 Boxplus-phi 基准算法的

42.0 秒,这为实时性要求高的应用场景提供了新的选择依据。同时,RN_Boxplus-phi 模型虽然性能优异(BLER=5.8844e-03),但其 115.5秒的运行时间仍显著长于 SRN 版本,进一步验证了简化网络结构在短码条件下的实用性。这些结果说明,在考虑提前终止机制的实际系统中,需要在误码率性能和响应速度之间进行更精细的权衡。

结论:

在本文中,我们提出了一种使用残差神经网络作为解映射器的LDPC 解码方法,该方法在相对苛刻的实验条件下取得了相对较好的解码效果。 虽然我们的研究提供了有价值的见解,但也存在一些局限性。 首先,我们的样本量限制了研究结果的推广性。 其次,我们只研究了 RN_boxplus-phi 模型对长代码的有效性,没有对中短代码进行实验。未来的研究应考虑对中短码的影响,以及其他机器学习方法在纠错码中的应用。

参考文献

[1] Nguyen, H. T., Bottone, S., Kim, K. T., Chiang, M., & Poor, H. V.

(2021, December). Adversarial neural networks for error correcting codes.

In 2021 IEEE Global Communications Conference (GLOBECOM) (pp.

01-06). IEEE.

[2] Guan, W., & Liang, L. (2023). Check-Belief Propagation

Decoding of LDPC Codes. IEEE Transactions on Communications, DOI:

10.1109/TCOMM.2023.3308155.

[3] Rosseel, J., Mannoni, V., Fijalkow, I., & Savin, V. (2022).

Decoding Short LDPC Codes via BP-RNN Diversity and Reliability

Based Post-Processing. IEEE Journals & Magazine.

[4] Nachmani, E., Bachar, Y., Marciano, E., Burshtein, D., & Be'ery,

Y. (2018). Near maximum likelihood decoding with deep learning. arxiv

preprint arxiv:1801.02726.

[5] Lugosch, L., & Gross, W. J. (2017, June). Neural offset min-sum

decoding. In 2017 IEEE International Symposium on Information Theory

(ISIT) (pp. 1361-1365). IEEE.

[6] Jamali, M. V., Saber, H., Hatami, H., & Bae, J. H. (2023).

ProductAE: Toward deep learning driven error-correction codes of large

dimensions. arxiv preprint arxiv:2303.16424.

[7] Nachmani, E., & Be’ery, Y. (2022). Neural decoding with

optimization of node activations. IEEE Communications Letters, 26(11),

2527-2531.