源-网-荷-储协同运行的混合多智能体分层优化方法

Abstract：The large-scale integration of renewable energy into the power grid increases the uncertainty and volatility of power supply， complicating system scheduling and leaving user-side flexibility resources underexploited by conventional methods. This paper proposes a hierarchical hybrid multi-agent system （MAS） architecture， which consists of strategic decision-making，aggregation optimization， and local control layers， the proposed approach overcomes the limitations of traditional single-method solutions and significantly reduces the dimensionality and computational complexity of the optimization problem. It offers both theoretical and practical insights into the coordinated operation of source-grid-load-storage in modern power systems. Keywords：Multi-agent system;Mixed-integer linear programming;Coordinated optimization;Distributed model predictive control;

1 引言

在“双碳”战略目标的推动下，以风电和光伏为代表的新能源在电力系统中的渗透率不断提高，给新型电力系统的稳定与经济运行带来诸多挑战[1]。传统调度方法难以应对高比例新能源带来的日内功率剧烈变化，供需匹配性差、复杂度高等问题，系统经济运行面临巨大压力。本文提出一种基于多智能体系统（MAS）的分层协同优化策略，通过引入马尔可夫博弈等人工智能方法，构建动态协调机制，以应对多主体、多目标、多约束条件下的复杂优化问题。

2 研究方法

2.1 MAS 框架概述

多智能体系统（MAS）源于人工智能领域，其具备分布、自治与协作的特点，已广泛应用于智能电网、工业控制等复杂系统。MAS 通过多个具有感知、决策与执行能力的智能体（Agent）之间的协作，实现对宏观系统的优化调控。该框架结合 IEC 61850等通信标准，能够有效支持分布式能源（DER）的即插即用与协调控制[2]。

2.2 分层系统架构

本文借鉴分层递阶控制思想，将 MAS 划分为战略决策、聚合优化和末端控制三个层级（图 1），在保证系统全局优化的同时，显著提升计算效率与控制可靠性。

图 1 基于分层递阶控制理论的MAS 分层架构

战略决策层对应区域能源调度中心，负责将长期目标（如年度碳减排指标）分解为短期调度计划，并协调多区域、多时间尺度的资源分配问题。该层决策变量既包括连续的发电功率与碳排放量，也涉及离散的机组启停与配额交易状态。采用混合整数线性规划（MILP）方法[3]，以系统总成本最小为目标，综合考虑发电成本、碳成本及配额交易成本，建立优化模型，并引入碳指标分解、机组运行与电网安全等约束条件。

聚合优化层位于区域调度层面，负责将上层指令分解并分配给各类终端设备。该层问题被建模为部分可观测马尔可夫博弈，每个智能体根据局部观测信息（如剩余碳指标、频率偏差、节点电价等）决策其调度行为[4]。通过设计多目标奖励函数，统筹经济性、环保性与稳定性，并采用多智能体强化学习算法进行策略求解，实现分布式协同优化。

末端控制层由各类终端控制设备构成，如储能单元、可调负荷、分布式电源等。该层采用分布式模型预测控制（DMPC）策略[5]，各设备根据本地预测模型和优化目标，在满足物理与系统耦合约束的前提下，实时调整运行状态，实现电压、功率等物理量的快速稳定控制。

通过使用分层架构融合 MAS 框架避免海量数据直接汇总至中央处理器进行处理，可以有效降低计算复杂度和提升控制效率，各层级智能体优化算法、数据粒度及决策频次如表所示。

表 2 各层智能体密度梯度分布

3 结论

本文提出了一种基于多智能体系统的分层协同优化策略，通过战略决策、聚合优化与末端控制三个层级的协调配合，有效解决了高比例新能源接入下电力系统源-网-荷-储协同运行的复杂问题。战略层采用MILP 进行资源统筹，聚合层利用多智能体强化学习实现动态优化，控制层通过DMPC 执行快速响应。该策略为新型电力系统提供了多时间尺度、多主体协同的优化方案，有助于提升电网对新能源的消纳能力与运行灵活性，支持“双碳”目标实现。后续将重点研究异构设备兼容与边缘计算融合等关键技术，推动实际应用落地。

参考文献

[1]常笑，刘黎明，刘朝旭，等.农户土地利用决策行为的多智能体模拟方法[J].农业工程学报，2013，29（14）：227-237.

[2]冯剑冰，余涛，程乐峰.自愈控制方法及其在地铁供电系统中的应用研究与展望[J/OL].综合智慧能源，1-21[2025-03-06].http：//kns.cnki.net/kcms/detail/41.1461.tk.20250228.1536.004.html.

[3]后莉，裴婷婷，陈英，等.基于MAS 的梯田非粮化农户行为决策机制与模拟研究[J/OL].农业资源与环境学报，1-16[2025-03-06].http：//kns.cnki.net/kcms/detail/12.1437.S.20250228.1116.004.html.

[4]夏新海，王首硕.强化学习下动态用户均衡路径选择研究[J/OL].公路工程，1-13[2025-03-06].http：//kns.cnki.net/kcms/detail/43.1481.U.20241223.1432.002.html.

[5]张廷军.新型配电网智能协同电压调节与经济运行策略研究[D].南京邮电大学，2023.DOI：10.27251/d.cnki.gnjdc.2023.000019.

源-网-荷-储协同运行的混合多智能体分层优化方法

董威

Related Articles

AI 助教，实验无忧：生成式人工智能突破小学科学实验安全与资源限制的应用探索

基于教学评一体化的中职英语阅读教学策略研究

新能源工程机械在实际应用中的性能评估与发展趋势

论会计信息透明度对企业融资成本的影响机制

高中语文议论文写作教学中论证结构搭建策略研究