高性能高安全的密码机分析
刘翔宇 吴继波
浙江青兴科技有限公司 310013
引言:数字化浪潮席卷全球,信息安全已经成为了国家战略安全的首要话题,其对于保护公民个人隐私以及维护社会经济稳定等均具有重要意义。密码技术作为保障信息安全的核心支撑,随着近年来的发展逐渐形成了更高水平的密码机。通过专用硬件设备,在金融、政务以及云计算等众多领域均有所应用。而随着数据量的激增以及攻击手段的升级,高性能与高安全逐渐成为了密码机的核心要求。
1 高性能高安全密码机关键技术
1.1 高性能架构
对当前常见的主流密码机基本性能进行对比,如表1 所示。
表1 主流密码机性能对比

高性能高安全密码机的设计,核心目标在于满足安全性前提,促使加密、解密、签名、验证等环节吞吐量最大化并降低延迟。设计系统架构,采用多核CPU/FPGA 实现算法并行加速,通过任务分解以及分布式计算,利用多核处理器所具有的并行能力,可满足在同一时间内的多个密码运算需求[1]。同时通过集成专用密码算法芯片构建硬件加速引擎,在专用集成电路或指令集扩展下,在硬件层对密码算法关键步骤加以优化,从而促使密码机软件处理瓶颈得以破除。并联合高速总线接口,通过PCIe4.0/5.0 提供高带宽数据通道尽可能消除以往数据 I/O 瓶颈,确保密码机加密引擎始终保持满负荷状态投入工作。
1.2 高安全防护机制
使用温度传感器对密码机使用环境温度进行监测,操作范围控制在-40°C~85∘C 以内,在超出范围后将触发告警,从而根据环境参数异常判定潜在攻击,及时进入安全模式。基于逻辑安全控制安全防护,主要通过Boot ROM储存 RSA-3072 公钥实现安全启动,并逐级验证密钥,配合使用白盒加密技术对密钥进行分段储存,仅通过单一片段无法还原完整的密钥,对冷启动攻击起到一定的阻止作用。此外,联合 FIPS140-3 合规性认证,通过国际权威认证验证密码机安全设计的有效性,从而形成良好安全防护作用。对比主流密码机的安全防护能力,如表2 所示。
表2 安全防护能力对比

1.3 算法支持与优化
密码机的算法能力将直接对其使用场景以及性能上限产生影响,基于国密算法支持与国际算法优化两个角度展开研究分析,其中国密算法主要是通过硬件加速实现对密码机运行的有效支撑。常见包括SM4、SM2、SM3等算法。SM4 算法主要功能为对称加密,通过128 位并行S 盒查找,设计32 位流水线,基于片上密钥扩展的方式,促使密码机吞吐量将达到120Gbps,对比软件提升了超50 倍以上。而SM2 算法最为主要的功能就是著名的非对称加密,基于素数域256 位模乘专用ALU,联合预计算点加速处理,促使签名速度达到20000 次/秒。此外,SM3 哈希算法也是当前国密算法支持中较为常见的算法应用,其主要通过消息扩展与压缩合并计算,创建64 级流水线,每一消息块结构为8 周期,吞吐量提升到80Gbps。
而对于国际算法优化而言主要依靠 AES-256、RSA-4096、ECC-P384等降低通信传输延迟。为实现全球兼容应用,密码机面向国际主流算法实现极致化的性能优化。如 AES-256 算法通过搭建 GCM 模式全流水线实现认证与加密并行,并利用IntelAES-NI 指令,单指令完成1 轮数据处理,促使密码机的加密吞吐量可达到100Gbps。ECC-P384 算法负责对签名数量加以优化,利用NIST 曲线专用模约减器实现快速约减计算,最高可实现15000次/秒。与此对应的是签名速度的优化,通过 RSA-4096 算法利用蒙哥马利模乘加速,缓存密钥预计算签名速度最高可达到500 次/秒。
表2 国际算法优化效果

2 性能测试
对密码机性能展开测试,基于可控环境下模拟真实业务负载情况,量化密码机的稳定性、吞吐量以及延迟情况。准备被测密码机、测试主机、以 200Gbe RDMA 链路作为网络环境,基于高带宽数据注入可对密码机的数据处理效率进行精确的计算。联合监测设备,对密码机吞吐量与时延进行精准测试。测试中,要求测试主机的CPU 性能大于 HSM5 倍以上,确保压力完全作用于密码机,并搭建RDMA 直通架构,应用绕过OS 内核直接向 HSM 访问,从而降低延迟。设计 8~32 并发线程下的 10 万次签名测试SM2 签名,模拟映射支付系统峰值交易场景。并以 50Gbps 数据流以及1kB~1MB 的分块大小对AES-CBC 加密进行测试。同时模拟综合业务场景测试密码机混合复杂,实测性能结果如表4 所示[2]。证明HSM-C 在并行架构与PCIe5.0 加持下性能领先,HSM-A 在安全认证方面表现突出。
表4 性能测试结果

结束语:本文通过对当前技术较为成熟的主流密码机性能进行分析,从架构设计、算法优化、安全防护等角度详细对比了不同密码机的性能与安全防护表现。结合实际性能测试,证明不同型号下的密码机的性能与安全性具有一定差异,在实际中可根据使用需求进行差异性选择。
参考文献:
[1]董建阔,黄跃花,付宇笙,等.基于异构多核心 GPU 的高性能密码计算技术研究进展[J].软件学报,2024,35(12):5582-5608.
[2]李萍,朱春琴,曹磊,等.基于高性能密码实现的大数据安全研究[J].无线互联科技,2021,18(01):104-107.