源-网-荷-储协同运行的混合多智能体分层优化方法
董威
辽河油田公司石油化工技术服务分公司 辽宁 盘锦 124010
Abstract:The large-scale integration of renewable energy into the power grid increases the uncertainty and volatility of power supply, complicating system scheduling and leaving user-side flexibility resources underexploited by conventional methods. This paper proposes a hierarchical hybrid multi-agent system (MAS) architecture, which consists of strategic decision-making,aggregation optimization, and local control layers, the proposed approach overcomes the limitations of traditional single-method solutions and significantly reduces the dimensionality and computational complexity of the optimization problem. It offers both theoretical and practical insights into the coordinated operation of source-grid-load-storage in modern power systems. Keywords:Multi-agent system;Mixed-integer linear programming;Coordinated optimization;Distributed model predictive control;
1 引言
在“双碳”战略目标的推动下,以风电和光伏为代表的新能源在电力系统中的渗透率不断提高,给新型电力系统的稳定与经济运行带来诸多挑战[1]。传统调度方法难以应对高比例新能源带来的日内功率剧烈变化,供需匹配性差、复杂度高等问题,系统经济运行面临巨大压力。本文提出一种基于多智能体系统(MAS)的分层协同优化策略,通过引入马尔可夫博弈等人工智能方法,构建动态协调机制,以应对多主体、多目标、多约束条件下的复杂优化问题。
2 研究方法
2.1 MAS 框架概述
多智能体系统(MAS)源于人工智能领域,其具备分布、自治与协作的特点,已广泛应用于智能电网、工业控制等复杂系统。MAS 通过多个具有感知、决策与执行能力的智能体(Agent)之间的协作,实现对宏观系统的优化调控。该框架结合 IEC 61850等通信标准,能够有效支持分布式能源(DER)的即插即用与协调控制[2]。
2.2 分层系统架构
本文借鉴分层递阶控制思想,将 MAS 划分为战略决策、聚合优化和末端控制三个层级(图 1),在保证系统全局优化的同时,显著提升计算效率与控制可靠性。
图 1 基于分层递阶控制理论的MAS 分层架构

战略决策层对应区域能源调度中心,负责将长期目标(如年度碳减排指标)分解为短期调度计划,并协调多区域、多时间尺度的资源分配问题。该层决策变量既包括连续的发电功率与碳排放量,也涉及离散的机组启停与配额交易状态。采用混合整数线性规划(MILP)方法[3],以系统总成本最小为目标,综合考虑发电成本、碳成本及配额交易成本,建立优化模型,并引入碳指标分解、机组运行与电网安全等约束条件。
聚合优化层位于区域调度层面,负责将上层指令分解并分配给各类终端设备。该层问题被建模为部分可观测马尔可夫博弈,每个智能体根据局部观测信息(如剩余碳指标、频率偏差、节点电价等)决策其调度行为[4]。通过设计多目标奖励函数,统筹经济性、环保性与稳定性,并采用多智能体强化学习算法进行策略求解,实现分布式协同优化。
末端控制层由各类终端控制设备构成,如储能单元、可调负荷、分布式电源等。该层采用分布式模型预测控制(DMPC)策略[5],各设备根据本地预测模型和优化目标,在满足物理与系统耦合约束的前提下,实时调整运行状态,实现电压、功率等物理量的快速稳定控制。
通过使用分层架构融合 MAS 框架避免海量数据直接汇总至中央处理器进行处理,可以有效降低计算复杂度和提升控制效率,各层级智能体优化算法、数据粒度及决策频次如表所示。
表 2 各层智能体密度梯度分布

3 结论
本文提出了一种基于多智能体系统的分层协同优化策略,通过战略决策、聚合优化与末端控制三个层级的协调配合,有效解决了高比例新能源接入下电力系统源-网-荷-储协同运行的复杂问题。战略层采用MILP 进行资源统筹,聚合层利用多智能体强化学习实现动态优化,控制层通过DMPC 执行快速响应。该策略为新型电力系统提供了多时间尺度、多主体协同的优化方案,有助于提升电网对新能源的消纳能力与运行灵活性,支持“双碳”目标实现。后续将重点研究异构设备兼容与边缘计算融合等关键技术,推动实际应用落地。
参考文献
[1]常笑,刘黎明,刘朝旭,等.农户土地利用决策行为的多智能体模拟方法[J].农业工程学报,2013,29(14):227-237.
[2]冯剑冰,余涛,程乐峰.自愈控制方法及其在地铁供电系统中的应用研究与展望[J/OL].综合智慧能源,1-21[2025-03-06].http://kns.cnki.net/kcms/detail/41.1461.tk.20250228.1536.004.html.
[3]后莉,裴婷婷,陈英,等.基于MAS 的梯田非粮化农户行为决策机制与模拟研究[J/OL].农业资源与环境学报,1-16[2025-03-06].http://kns.cnki.net/kcms/detail/12.1437.S.20250228.1116.004.html.
[4]夏新海,王首硕.强化学习下动态用户均衡路径选择研究[J/OL].公路工程,1-13[2025-03-06].http://kns.cnki.net/kcms/detail/43.1481.U.20241223.1432.002.html.
[5]张廷军.新型配电网智能协同电压调节与经济运行策略研究[D].南京邮电大学,2023.DOI:10.27251/d.cnki.gnjdc.2023.000019.