基于机器学习面向物联网网络攻击检测研究

1、系统架构设计

1.1 数据采集模块

物联网网络攻击检测系统的基石是数据采集模块，本研究使用了如图1 的模块。

图1 数据采集模块框架

数据孤岛问题的解决靠的是采集模块的联邦化设计，各节点可在本地完成初步数据过滤和脱敏工作且只需把特征向量上传到中心节点就能保证原始数据留在本地从而确保数据隐私安全。如图 1 所示，采集模块针对物联网设备资源受限的特点进行了优化并采用了自适应采样策略，该策略会依据设备计算能力与网络带宽动态调整采样率以达成资源消耗和数据完整性的平衡。

12 特征提取模块

统计特征层面会提取诸如包大小、到达间隔、流持续时间之类的流量统计特征以及像协议类型、头部字段这样的协议特征还有连接状态、请求-响应模式等会话特征。由于物联网场景下存在多协议问题所以模块实现协议适配器以支持从MQTT、CoAP 等特定协议里提取语义特征。

1.3 检测模型模块

物联网网络攻击检测系统中，检测模型模块是智能核心，负责依据提取的特征来识别网络攻击，本研究开发的检测模型模块运用把创新的FTL-GAN 混合框架，从而实现跨域知识迁移以及对抗样本生成，有效解决了物联网环境中数据孤岛和小样本学习的问题。

1.4 告警模块

物联网网络攻击检测系统有个告警模块，该模块属于其输出环节且承担着把检测结果变成可执行的安全响应策略的任务，本研究的告警模块能够在某种程度上实现从攻击检测到响应处置的全流程闭环管理。

动态风险评估机制率先被模块实现，该机制依靠威胁情报关联与攻击场景上下文分析对检测出的攻击开展实时风险等级评定以防止告警风暴出现，这个引擎借助攻击链分析技术把相关攻击事件关联起来并展现完整的攻击路径从而让分析成本大大降低。

1.5 参数调优

检测系统的性能受模型参数调优的影响极为关键，所以本研究用贝叶斯优化算法来自动调整超参数，跟传统的网格搜索方法比起来效率提高了30% ，其目标函数设计如下：

其中，下一个采样点用 a 表示，期望改进函数为 EI，参数搜索空间是x，当前观测到的最优函数值由 f（x⁺）来体现，并且关键超参数包含学习率、批量大小、LSTM 隐藏层单元数量以及正则化系数。借助贝叶斯优化，最终确定学习率为 0.001 并采用 Adam 优化器，将批量大小设成 64 以达成训练效率与内存占用之间的平衡，LSTM 隐藏层单元数量定为 128 既可保持检测精度又能削减计算开销，L2 正则化系数设为 0.001 能有效地抑制过拟合。另外，在联邦学习场景下，本研究也优化了和通信效率相关的参数，这样既能确保模型收敛又可减少通信开销。

2、实验与结果分析

如表 1 所示，混合框架的实测性能显著优于基线模型。相较于传统LSTM，其能耗降低 12.5% （），同时保持 94.3% 的检测精度。在 72 小时连续运行测试中，系统未出现性能衰减，平均 CPU 占用率稳定在 25% 以下。

表 1 与基线模型性能对比（CIC-IoT-2022 数据集）

3、结论

在物联网网络环境中，攻击检测面临着数据孤岛、隐私保护以及资源受限这些关键挑战，本研究针对这些问题提出一套基于机器学习的创新解决方案，构建起 FTL-GAN 混合框架，从而将跨域知识迁移和对抗样本生成有机结合起来并有效突破小样本学习瓶颈。

参考文献

[1]Google Brain. TinyML-IDS 2.0：Ultra-Lightweight Intrusion Detection for IoT[J]. ACM SenSys， 2024.

[2]Yusung L ，Woohyun K .Fault detection and diagnosis for variable refrigerant flow systems by using virtual sensors and deep learning[J].Energy Reports，2024，11471-482.

[3]龚琴;柯善良;.基于机器学习的物联网反入侵检测方法研究[J].内蒙古民族大学学报（自然科学版），2021（03）：33-38.