中国核电数据治理顶层设计的建议
杨强 刘旭嘉 朱云飞
核电运行研究(上海)有限公司
摘要:在中国核电集约化改革和高质量发展的要求下,数据已成为中国核电打造新质生产力的关键要素。自从1991年秦山核电投入运营以来,中国核电经过三十余年的发展,在核电站全生命周期各个节点积累了海量有价值的数据。然而,由于缺少公司层级的数据治理体系,数据的价值没有充分释放。本文从中国核电的面临的挑战出发,阐述了数据在解决这些挑战的作用,并进一步剖析了中国核电的数据治理现状,识别出四项关键痛点。最后,针对数据战略、组织机构、制度体系、能力建设、数据应用、技术平台等六个方面提出建议。
关键词:大数据;数据治理;中国核电;核电行业
中图分类号: 文献标志码:A
1 前言
核能利用是一项多学科、多专业相结合的大型复杂系统工程,涉及的产业链条复杂,整个生命周期覆盖规划、选址、设计、建安、调试、运行到退役等各个阶段[1],每个阶段均会产生海量的结构化数据、非结构化数据或实时/时序数据。如果这些复杂繁多、多源异构的数据不能够进行统一的规划管理就会导致数据利用率偏低、数据价值难以充分释放。
“十四五”以来,为了实现标准化、规模化、国际化发展战略,实现中国核电高质量发展,中国核电加快了数字化转型的步伐。中国核电希望通过核能与数字技术的深度融合,打破传统模式下时空作业限制,以核电全生命周期、全要素的信息化、数字化、智能化为核心,统筹发展和安全,打造数据驱动、集成创新、合作共赢的数字化能力体系,着力提升产业链、供应链“安全、高效、经济、绿色”水平,着力构建现代化能源体系。
从1991年秦山核电站投入运行以来,中国核电尽管积累了海量的覆盖核电站全生命周期的数据。由于,中国核电存在着堆型多样化、发展阶段和业务成熟度不同以及成员单位之间管理理念的差异的问题,导致了成员单位之间数据标准不统一。除此之外,还存在数据质量不高、数据安全体系缺失,数据平台不完善等一系列问题。这些问题给中国核电的数字化转型带来了一定的困难。因此,中国核电亟需在“两基础、两架构”的指导下,构建完整、科学、有效的数据治理体系,为中国核电的数字化转型夯实数据基础。
2 中国核电面临的挑战和对数据的需求
1.专业技术人才短缺
自2008年以来,我国核电进入快速发展阶段。截至2023年底,我国运行核电机组共55台(不含台湾地区),额定装机容量为5,703万千瓦 [2]。在建核电机组26台,总装机容量3,030万千瓦。其中,中国核电控股核电在运机组25台,控股在建及核准待建机组15台。中国核电不仅要在国内推动华龙一号机组的规模化建设和运营,还要与美、法、俄等发达国家的三代核电技术展开国际竞争,因此,中国核电需要大量有经验、懂技术、精通管理的专业人才。
中国核电面临着有经验的专业人才数量难以满足机组规模化、国际化发展的需要的挑战。以福清核电为例,截至2019年底,尽管福清核电员工有2100人,但平均年龄仅29岁[3]。另外,核电专业人才的培养周期很长,短时间内培养出合格的专业人才对中国核电也是一项很大的挑战。例如:从事核电站运行的操纵员从新员工培养成为高级操纵员至少花费需要7年时间。
数据在加速人才培养或者人工替代方面可以起到很好的支撑作用。例如:可以充分利用员工的技能评价、项目经验等画像数据,在知识管理系统中植入智能推荐算法针对不同员工做精准知识培训。也可以基于大数据、虚拟现实和增强现实等技术手段构建数字孪生电厂培训体系。甚至可以在工程建设、生产运行、设备维修等领域部署具备特定功能的数字员工代替人工。
2.核电业绩高位提升的压力
2023年,中国核电的25台核电运行机组保持安全稳定运行,其中WANO满分机组18台,综合指数98.22分,先进指标占比超过75%。但是,随着核电项目调试、运行机组越来越多,核电的业绩能否在现有高水准的基础上进一步提升是当前面临的重要挑战。为了解决这个挑战,中国核电推行“抓指标、强过程”的精细化管理理念,如:推动设备管理和人因管理精细化、大修管理精细化等等。
落地精细化管理的关键是实现生产运行、维修、设备等领域数据标准的统一和数据链路的贯通。当数据贯通和标准化后,可围绕标准化的数据开发针对具体场景的数据应用。例如:(1)利用数据分析对比技术,对大修全过程进行跟踪与分析,提升大修管理水平[4];(2)利用故障数据、工单数据、设备数据、实现动态风险源识别和指引,提前识别人因失误陷阱;(3)通过数字孪生实现机组异常问题复现及根本原因查找和维修作业预演等等。
3.降本提质增效的要求
近年来,由于工程建设、核燃料、以及原材料成本的上升,导致中国核电的核能发电成本上升,同时在市场电价普遍下行的压力下,公司围绕“降本、提质、增效”的目标,制定了一系列战略举措,具体包括:(1)业务标准化,即以制度体系、组织机构、标准体系、品牌文化和信息系统五个子体系为支撑,横向实现全生命周期管理、纵向实现各业务子领域标准化;(2)管理集约化,即集中人、财、物、技术、管理等生产要素,整合资源、更新迭代,向各个成员单位提供标准化和专业化的高质量服务;(3)电厂智能化,即推动建设全面感知、自主运行和少人值守的新一代数字化智能化核电厂以及核电行业的单兵装备、AI、机器人、大模型等一批全新的业务创新与应用。
业务标准化、管理集约化以及电厂智能化均离不开数据的支撑。业务标准化的落地依赖于系统标准化和数据标准化的实现。管理集约化则需要通过实现集约化中心与其他成员单位之间的流程和数据贯通,才能基于指标数据识别和改善价值链中关键流程的效率。电厂的智能化则更加依赖数据与技术的深度融合。
4.产业链协同亟待提升
中国核电的上游主要涉及三大行业:一是核电核心设备及辅助设备制造行业;二是核电工程管理与设计行业;三是核燃料循环行业。长期以来,我国的核电站工程建设以工程总承包(EPC)模式为主,工程总承包商对于中国核电的项目移交大多是纸质文档或电子文件的形式[5]。这些纸质文档或电子文件因没有完成数字化转换,导致无法有效利用,产业链的资源整合和协同创新更无从谈起。
核电工程总包商以及核电厂纷纷探索核电工程文档数字化移交方案,并取得了一定成果。例如:上海核工院提出了基于“核电厂分解结构”的文档移交模式—将工程建设过程中的各类三维模型、关系数据、原生型电子文件等依据树状目录结构进行组织、管理、维护与移交[6];中广核集团发布了“数字华龙”移交模式—以三维设计模型为基础,在建造过程中加载各类业务数据,实现三维模型、二维图纸智能联动和多维数据集成,实现核电工程数字化移交[7]。
从上海核工院和中广核集团的数字化移交方案不难看出,建立核电规划设计、采购施工、调试移交、运维退役全过程的数据贯通,统一数据标准,形成数据开放共享、协同应用的能力是提升中国核电产业协同的关键。
5.保障高效安全生产
安全是核电行业赖以生存的生命线,中国核电始终将核电安全视为第一责任。中国核电控股核电机组堆/机型复杂、新项目建设进入高峰期,安全质量管控存在风险。另外,核电机组设备管理仍存在短板弱项,关键敏感设备及部件管控、设备质量控制需进一步强化,防异物精细化管控能力需进一步提升。
对于在役和未来核电厂来说,在保障核电安全稳定高效运营方面,迫切需要利用现代信息技术、人工智能、大数据分析等先进技术,开展对机组、系统、设备运行状况的全面感知、预测和诊断的应用研究,研究符合中国核电与核能行业发展要求的设备可靠性管理业务模型,打造设备分级、预防性维修大纲管理、关键敏感设备管理、性能监测、寿期管理等设备可靠性管理标准业务模型,实现其与核电厂生产管理流程的融合贯通。同时,通过构建标准数据模型,建设系统与设备可靠性监测与诊断平台,通过引人动态阈值等大数据工具,降低系统漏报率、误报率,保障核电设备健康管理系统的有效性,逐步建设成涵盖异常识别,故障诊断、健康评估和性能预测的全流程运营辅助系统,完成从对故障的“被动反应”到“主动预防”的转变,从“对当前运行状态的故障检测与诊断”到“对未来运行状态的预测”的转变。
6.核心产品管理和技术迭代
中国核电核心产品“华龙一号”示范工程已全面建成。在“华龙一号”未来批量化建设过程中,不仅需要进一步提高“华龙一号”安全性、经济性和技术先进性,也需要不断加强管理能力、技术支持能力的同步建设。从强化和完善“华龙一号”主要的创新设计特征、提高单机组功率和机组可利用率、优化系统设计方案和配置、完善布置和土建结构设计、提高设备国产化率、提升电厂运行性能等方面着手,逐步推进“华龙一号”后续机型的技术升级以及核电站的综合运营能力的提升。
“华龙一号”凭借其卓越的技术和良好的用户反馈,逐渐在国际市场中占据了重要位置。但与此同时,“华龙一号”也面临来自欧美和俄罗斯等国家核电技术的竞争,在保持技术领先优势的基础上,提升“华龙一号”的经济性,增强管理能力和技术支持能力,也是增强国际竞争力的关键。
因此,“华龙一号”迫切需要实现业务、系统和数据的标准化,为华龙后续机型的原型设计及软件验证,以及安全审评提供重要的数据支撑。同时,对于标准化的历史数据进行分析,形成可快速推广的数字化标准包(包括规则库、导则、管理流程、业务规范等),加快投产周期,提升“华龙一号”规模化推广能力和国际竞争力。
3 中国核电的数据治理现状
1.公司级数据治理未开展
在中国核电首个集约化中心—数字化创新中心成立之前,尽管秦山核电、福清核电等成员单位有过数据治理的尝试,但治理的数据范围大多局限在自身电厂的少量业务领域。从中国核电层面来看,公司级数据治理体系尚未形成,具体表现在:(1)公司级数据标准缺失:中国核电的数据包含规划文件、设计文件、采购数据、施工数据、安装调试数据、维修数据、延寿数据、退役数据等海量数据[8],这些数据存储在大量的统建和非统建系统中,存在数据标准不统一的问题。另外,不同电厂之间由于机组类型不同,数据标准也存在较大差异。(2)数据安全保障缺失:尚未对整体数据资源进行全面的、系统的分类和分级,缺乏明确的安全级别划分。对数据从生成到销毁的全生命周期存在的安全风险缺乏全面的评估和防护。在数据泄露、丢失或破坏事件发生时,缺乏快速响应和处理的预案和能力。(3)数据质量提升难:数据质量管理制度缺失、数据认责不到位,使得业务人员参与数据质量整改提升的意愿不足,进而导致数据质量整改提升工作难以有效推进。(4)数据责权利不清:中国核电是一个拥有多个下属成员单位的企业,由于成员单位之间的数据资源持有权、数据加工使用权以及数据产品经营权尚未从中国核电层面确立,导致数据无法在各成员单位间充分共享。(5)数据应用匮乏:由于数据资源盘点和数据治理工作未开展,导致数据基础薄弱,数据应用覆盖度严重不足。
2.数据战略无规划
从2018年开始,国内的数据治理进入体系化发展阶段,随着数据资产管理相关理论体系与能力架构的逐步成熟,数据成为企业创新发展的重要动能,“数据战略”上升为企业核心战略之一,逐渐得到企业高层的高度关注。
在过去5年期间,秦山核电、福清核电等电厂均开展过数据治理的工作,但是在中国核电层面缺少总体规划。而同为能源行业的南方电网早在“十二五”时期就开启了数据治理之路,“十四五”期间更是发布了《“十四五”大数据发展专项规划》,形成集团级统一的数据战略规划蓝图,集团统筹推进公司各项数据管理工作,实现全网一盘棋、业务全覆盖。
3.数据平台不完善
秦山核电、福清核电、江苏核电等中国核电下属成员单位相继建设了数据平台,完成了核心业务系统的数据采集,基于汇聚的数据搭建了相关数据应用,如:福清核电搭建了管理驾驶舱,并取得了一定成效,但整体功能不完善。综合秦山核电等成员单位的数据平台现状,主要存在以下不足:
a)多源异构数据汇聚能力不足。未提供实时数据、非结构化数据采集功能,无法支撑各专业中心基于实时数据、非结构化数据的应用场景需求。
b)数据治理功能不足。现有数据平台功能主要聚焦数据采集及开发,缺少如数据质量管理、数据标准管理、数据血缘分析等数据治理功能,导致数据质量参差不齐,数据异常难定位。尤其当数据源头发生变化时,无法通过血缘溯源定位。
c)数据共享服务能力不足。各成员单位数据平台主要面向本单位内部提供数据服务,相互之间缺少数据流通共享机制,总部和各专业中心在获取数据时,需要到不同的数据平台中查询和获取数据,甚至需要通过线下方式获取数据,未实现数据的互联互通。
d)数据要素流通支持能力不足。目前的数据平台主要以汇聚内部各信息系统所产生的结构化数据为主线,不具备与外部数据协同交互的能力。
4.数据治理难落地
在之前的信息化建设中,秦山核电、福清核电、江苏核电等成员单位在本单位的数据治理工作中建立了部分数据治理相关制度,并在数据标准等领域进行了运作,取得了一定的成果。集约化改革后,成员单位原有数据治理团队成员全部集中到数字化创新中心。数字化创新中心的数据治理工作尚处于起步阶段,尽管发布了《数据管理办法》等多项制度文件,但是由于数据治理组织未成立以及数据平台不完善,导致了数据治理的制度、规范难以落地执行。
4 中国核电数据治理建议
4.1 确定数据发展战略
战略是企业长期发展规划及资源配置的一系列行动,对于企业持续稳定发展具有重要的指导意义。在数字时代下,数据战略已成为组织开展数据资源管理的基础,是数据资源管理工作长期高效开展的指引。
中国核电坚持以习近平新时代中国特色社会主义思想为指导,坚持标准化、规模化、国际化发展战略,并制定了2050远景目标—“成长为具有全球竞争力的世界一流清洁能源服务商”。
核电运行研究院数字化创新中心牵头推进中国核电的数字化转型工作,以《国家能源局关于加快推进能源数字化智能化发展的若干意见》为依据,以业务引领、技术赋能为导向,以人工智能、数字孪生等新兴技术为驱动,编制了《核电数字化转型总体方案》。
中国核电的数据战略是实现数字化转型的基础,更是中国核电实现2050远景目标在数据方面所做的方向性选择和资源的聚焦。作者建议从中国核电的业务挑战和数据治理现状出发,以DCMM(数据管理能力成熟度模型)、DAMA等方法论为指导,借鉴国家电网、南方电网的先进实践,将“统一数据标准、深化数据应用、产业链数据贯通”设定为未来五年的数据战略目标,围绕数据治理组织、制度、技术平台、能力建设、数据应用以及数据要素流通六个维度制定具体的战略举措,形成公司统一的数据战略规划蓝图,统筹推进各项数据治理工作。
4.2数据治理组织
数据治理绝非是一个部门的事情,它涉及到业务、IT、管理等方方面面,仅仅依靠技术部门来推动和开展数据管理工作是无法取得成功的,只有来自更高层管理者的驱动力,建立自上而下的跨部门跨业务条线的组织体系,才能保证企业内部的高效协作。数据治理组织一般包含决策层、管理层和执行层三个层级。(1)决策层,也称为数据治理委员会,是开展数据管控和数据运营等各项工作的最终决策机构,它是一个虚拟组织,由公司高层担任,审批和授权数据治理相关重大事项,全面协调、指导和推进公司的数据治理工作,督促数据管理层不断提升数据治理能力,挖掘数据价值;(2)管理层,也称为数据治理办公室,负责建立组织的数据治理体系,评估数据治理和数据运营工作的有效性和执行情况,定期向决策层汇报。根据职能的不同,可以在数据治理办公室下设分多个管理小组,如:质量管理组、标准管理组、架构管理组、安全管理组、运营组及平台组等;(3)执行层,是一个由业务专家和数据治理执行员工共同组成的混合团队,根据数据治理制度规范的要求共同推动数据治理各项制度规范的落地执行。
中国核电是一个具有多家下属成员单位的企业,厘清总部对下属成员单位的数据治理管控模式是构建数据治理组织的前提。一般来说,数据治理管控模式包含分散模式、集中模式、联邦模式三种。其中,分散模式是指数据管理职能分布在各个业务部门和IT部门。它的优点是组织机构相对扁平,缺点是过多的人员参与治理和制定决策,实施协作决策通常比较困难。集中模式是指所有工作都由数据管理组织掌控,它的优点是为数据治理建立了正式的组织机构,且拥有一个最终决策人,职责明确,决策更容易,缺点是实施集中模式通常需要重大的组织变革。联邦模式提供了一个具有分散执行的集中策略,一个负责整个组织数据治理的主管领导,不同的业务线有权根据需求和优先级来适应要求。它的优点是能根据特定数据实体、部门或业务领域的优先级来确定优先级,缺点是管理起来较复杂,层次多,需要在业务线自治和企业的需求之间取得平衡,平衡会影响企业的优先级。
中国核电集约化改革后,将原有的数据管理人员集中到运行研究院数字化创新中心。为了与集约化改革相适应,作者建议中国核电对下属成员单位的数据治理采用集中管控模式。具体来说,中国核电委托运行研究院的数字化创新中心作为数据治理的统一组织,负责中国核电总部及各成员单位的数据治理工作,下属成员单位不再设置独立的数据治理组织。下属成员单位各业务部门设置数据治理接口人,配合数据治理执行落地。
4.3 数据治理制度体系
搭建数据治理制度体系的目的是激活各相关部门的数据治理工作,最终形成常态化、科学化的数据治理机制。中国核电拥有多个下属成员单位,成员单位之间针对数据的持有权、加工使用权以及产品经营权存在不同的理解,因此,明确各成员单位的数据“责权利”是制定数据治理制度的前提。
数据责权利
在数字化浪潮汹涌澎湃的当今时代,数据已成为关键的生产要素和重要的战略资源。然而,数据确权问题却一直困扰着我们,成为制约数据资源充分利用和数字经济健康发展的瓶颈。2022年12月19日,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”),从数据产权、流通交易、收益分配、安全治理等方面构建数据基础制度,提出20条政策举措。依据“数据二十条”,为保障数据在各成员单位间充分共享和高效利用,作者建议中国核电及各成员单位的数据持有权、数据加工使用权、数据产品经营权做如下设定:
1)中国核电数据在中国核电各成员单位间免费共享使用,中国核电及各成员单位在生产经营活动中产生的数据由中国核电享有数据持有权;
2)运行研究院数字化创新中心享有中国核电全量数据的加工使用权;
3)数据产品在中国核电内部推广不涉及数据使用费,数据产品在中国核电外部销售产生的收益由数据产品开发者与中国核电及其成员单位共享,数据产品经营权由运行研究院数字化创新中心持有。
数据治理制度
数据治理制度体系通常分层次设计,依据管理的颗粒度,制度体系可划分为组织级数据资产管理总体规定、管理办法、实施细则和操作规范四个层次[9]。其中,总体规定是从数据治理决策层视角出发,定义数据资源管理的目标、组织、责任;管理办法是从数据治理办公室视角出发,规定数据治理活动的管理目标、管理原则、管理流程;实施细则是从数据治理执行层的视角出发,围绕管理办法相关要求,明确各项活动落地执行的标准、规范、流程等;操作规范是从数据治理执行层的视角出发,依据实施细则,进一步明确各项工作需遵循的工作规程、操作手册等。
作者建议中国核电围绕数据资源、数据标准、数据质量、数据安全等方面构建“1+4+N+X”数据制度体系。其中,“1”是指数据管理办法,是中国核电数据治理制度体系的总纲,在总纲中明确中国核电数据治理决策机制,总部领导层、各成员单位以及数字化创新中心在数据治理体系中的职责。树立了“统一管理、分级负责,集中共享、服务应用,夯实基础、持续推进”的数据管理原则。“4”是基于数据管理办法四个具体管理制度,是对数据管理办法的细化,包括数据资源管理制度、数据标准管理制度、数据质量管理制度以及数据安全管理制度,覆盖DCMM方法论中的数据架构、数据标准、数据质量、数据安全、数据应用、数据生命周期六大能力域。“N”是上述“4”项制度的进一步细化,按照制度的要求对某项数据领域的具体工作进行规范,例如:《数据模型开发管理规范》、《元数据设计规范》等等。“X”是各成员单位根据业务现状、管理方式、数据特点、平台工具等因素制定符合自身的操作规范。
4.4 数据治理能力建设
基于DCMM、DSMM方法论,中国核电数据治理能力体系可聚焦于数据架构、数据标准、数据质量、数据安全、数据生存周期管理五项活动。
(1)数据架构:建立中国核电企业级数据架构标准,包括统一数据模型、统一数据目录、统一集成共享规范,其中数据模型实现核心业务和共性需求全覆盖。完成全业务领域的数据资源盘点,捋清数据分布关系,实现数据资源可视、可查;建立基于负面清单的集成共享机制,满足数据需求的及时响应,提升数据共享集成效率。
(2)数据标准:按照“业务引领”原则,通过基于业务的自上而下和基于系统的自下而上相结合的盘点梳理模式,开展中国核电数据标准制定工作,形成统一的业务术语、参考数据与主数据、指标数据等标准。并制定并发布相应的管理制度与标准规范,通过量化评价机制,优化管理规范和管理流程,实现了数据标准从标准制定到优化提升全过程管理。
(3)数据质量:构建从数据产生、数据入湖、数据应用的全生命周期质量管理机制,形成事前约束、事中校验、事后整改的管理工作闭环。其中,事前约束是在数据生产过程中,通过校验规则,对录入阶段的数据创建和存储进行把关,实现源头管控;事中校验是通过固化数据质量规则,在数据采集入湖过程进行校验,确保入湖的数据满足质量要求;事后整改在应用场景中进行校验,在应用过程中发现数据质量问题,并通过数据治理管控手段,组织相关方进行质量整改,持续提升存量数据质量水平,积累高质量数据。
(4)数据安全:构建全场景数据安全防护体系,重点从管理措施、技防措施和支撑保障等方面固化标准流程和机制,明确数据安全分区防护架构,建立多级安全分析监控体系,落实数据分级保护和合规审计要求,有效防范数据安全风险,常态开展数据安全攻防实战演习,实现全生命周期数据安全防护。强化数据安全防护,依据国家数据安全等相关法律法规要求,健全中国核电数据安全管理体系,形成中国核电数据分类分级规范、数据安全防护规范、数据安全评估规范、数据安全应急处置机制,信息系统在设计、开发、上线时须遵循数据安全“三同时”要求,建立全生命周期数据安全保护机制。
(5)数据生存周期管理:对照数据需求、数据设计与开发、数据运维、数据退役的能力标准,将公司数字化项目建设流程、数据运营服务与数据生存周期的各环节进行有机融合,实现对全生存周期的统筹管理、量化分析和持续改善,为数据安全、数据质量、数据应用等管理活动提供有力支撑。
4.5 数据应用
数据应用建设是数据治理工作推进的主要抓手,一般包含数据架构模式、单点数据应用模式以及大规划模式这三种模式[10]。其中,数据架构模式是指从底层数据切入,基于现有数据基础,盘点、建设、治理、应用层层展开。这种模式对企业整体的数据文化、数据治理水平要求较高,通常适用于数据量重、业务应用轻的大型技术型企业;单点数据应用模式是指以单点数据应用需求为核心开展数据治理,聚焦某个业务领域的数据应用、数据治理需求,在有需求、有资源、有驱动力的前提下,按需组织推进数据治理工作。这种模式适用于数据治理的价值尚未得到业务部门认可的企业;大规划模式,这种模式需要企业全面梳理业务的现状痛点及业务未来畅想,盘现状、规划未来,基于业务现在及未来的需求规划分析应用场景,在应用场景蓝图规划的范围内,全面的梳理数据的现状、规划数据的未来,针对蓝图规划中的数据需求,制定全方位策略和全面的规划体系,划分优先级,有节奏、有步骤地实现全面的数据治理。这种模式通常是企业的战略项目,由高层推进开展,对数据、业务协同性要求较高,整个过程涉及系统改造升级、业务流程优化再造,是企业全面升级的过程。
中国核电的数据治理的成熟度较低,尚未达到DCMM3级,“数据架构模式”显然不适用于当前的中国核电。考虑到中国核电正在进行业务标准化和数字化转型规划的工作,作者建议采用“大规划模式”开展数据应用的建设,也就是依托数字化转型规划,收集中国核电本部、各成员单位、各专业中心关于数据应用的场景需求,制定全面的数据应用规划体系,根据优先级有序开展数据应用专项建设和数据的治理。
4.6 数据平台
数据平台是中国核电数据治理的技术保障,为了满足上文中提到的业务挑战,数据平台应至少具备数据汇聚能力、数据开发能力、数据治理能力、数据服务能力、数据安全能力以及数据流通这六大能力。
(1)数据汇聚能力:提供多源异构数据采集、交换集成和存储能力,支持多种数采集方式、离线和实时数据同步;同时具备高效、可扩展的高性能数据存储能力,支持海量结构化数据、非结构化数据、半结构化数据、时序数据的存储,并且保证数据的安全性和可靠性。
(2)数据开发能力:具备处理不同类型数据的处理能力,提供可视化的离线开发、实时开发、算法开发环境,降低数据开发人员的使用门槛,支撑实现批计算、流计算、在线查询、即席分析等数据计算能力。同时提供智能调度、智能运维、监控告警等系列工具,保证统一数据平台计算性能和系统稳定性。
(3)数据治理能力:需要基于中国核电统一的、可执行的数据标准实现数据标准化、规范化的治理运营,提供数据资产、数据血缘、数据质量、元数据、数据生命周期进行管理和可视化展示,使企业数据资产可见、可用。
(4)数据服务能力:需提供数据的统一开放、统一服务,提供外部需求方使用,支撑数据更好的服务于业务应用, 同时应提供接口性能实时监控、权限管控、API发布等功能,提高数据开放与共享效率。
(5)数据安全能力:需要提供数据安全保障,包括数据分类分级、敏感数据发现、数据加密、数据备份、数据访问控制等,以便保护数据资产安全性,防止数据泄露。
(6)数据流通能力:需具备多元化、快捷高效、安全可控的数据流通能力,支撑数据资产以不同形式满足各类业务需求,进一步盘活数据资产流通,实现数据价值变现。
数据平台除了满足共享的数据需求,也需要满足下属成员单位的个性化需求。作者认为采用“一湖多仓”架构体系更加贴合未来使用场景,即在中国核电商网云上搭建 “湖仓一体”的中央湖,同时在边侧(成员单位侧)搭建独立数仓。
“一湖”是指中国核电的统一的“云上中央湖”,存储和管理中国核电所有有价值的结构化、非结构化、实时/时序数据,至少包含“数据交互处理”、“计算存储”、“数据集成”、“数据开发”、“数据建模”、“数据治理”、“数据服务”、“数据门户”8个模块。
(1)数据交互处理:负责非标业务系统数据接入、基于统一标准的数据预处理以及数据导入导出,为数据集成提供标准数据;
(2)计算存储:负责海量异构数据的存储和计算,为中国核电不同应用场景、不同类型数据提供存储和计算分析。本部面向大模型应用场景建设提供数据检索分析功能,方便后续大模型组件扩展,同时面向高性能计算场景提供缓存服务。
(3)数据集成:负责云上中央湖全量数据汇聚、集成,边仓商业数据采集,支持不同类型数据的批量、全量、增量同步。
(4)数据开发:负责提供一站式的集成开发环境,满足数据集成开发、数据挖掘算法开发、数据主题库建设等开发需求。
(5)数据建模:提供基于维度建模理论的数仓分层设计、数据标准定义、数据指标定义及指标开发,实现数据模型表到计算引擎物化及应用。
(6)数据治理:提供数据从采集到数据消费的全链路数据治理能力,支撑数据治理体系全面落地,包括数据标准管理、数据架构管理、数据质量管理、数据安全管理及数据运营管理等功能。
(7)数据服务:承接中国核电云上中央湖对外数据服务、对边侧数仓数据同步、交互能力,以及边仓对自己业务数据需求支撑,通过统一数据服务提供稳定、高效、安全的全域数据服务,支撑不同部门间、不同业务系统之间数据访问。
(8)数据门户:数据门户定位为集数据资产管理、数据分析、数据可视化及数据共享功能于一身的统一出口,打造统一用户体系、统一身份认证、统一权限管理,实现数据平台和业务系统间无缝互通,为中国核电各级用户提供数据资产集中展示、高效利用和便捷访问。
“多仓”是指在电厂为代表的成员单位侧搭建独立数仓,以满足该成员单位个性化的数据使用需求。考虑到成本因素,边侧数仓功能尽量简化,涵盖“数据交互处理”、“计算存储”、“数据集成”、“数据服务”四个模块即可,主要承担边侧实时数据、非结构化数据的存储和计算、数据交互处理区运行数据存储和计算、极端情况下边侧数据服务能力。
5 结论
中国核电历经30余年的发展,积累了海量核电站生命周期数据。由于专业数据治理组织未成立、数据平台功能不完善、中国核电及成员单位数据产权不清等问题导致数据治理活动未在中国核电层面开展。数据资源目录缺失、数据标准不统一、数据质量不高、数据应用匮乏、数据安全保障困难、上下游数据未贯通等一系列问题亟待解决。本文参考了DCMM、DAMA等方法论,从中国核电的现状出发,围绕数据战略、组织机构、制度体系、能力建设、数据应用、技术平台等六个方面给出顶层设计的建议。
参考文献(References):
[1]卢铁忠.着力核电数字化创新促进核能产业高质量发展[J].红旗文稿,2023,(16):33-36.
[2]中国核能行业协会.中国核能发展报告(2024)[M].北京:社会科学文献出版社,2024: 01-02
[3]周军.创新核电企业人才培养机制打造高效核电人才培养平台[J].现代企业文化,2019(26):174-176.
[4]伍吉泽. 数字核电功能规划与架构设计[J]. 中国核电,2017,10(3):348- 354.
[5]杨伟伟. "华龙一号"核电厂工程数据数字化移交研究[J]. 科学技术与工程,2020,20(36):14935-14943.
[6]钱爃. 核电工程项目文档数字化移交模式研究[J]. 中国档案,2023(5):58-59.
[7]中国核能行业协会.中国核能发展报告(2023)[M].北京:社会科学文献出版社,2023: 127-128
[8]任景莉,杨盼. 核电站全生命周期数据管理框架体系构建与发展建议[J]. 中国工程科学,2022,24(2):152-159.
[9]CCSA TC601大数据技术标准推进委员会.数据资产管理实践白皮书6.0版[R/OL].
http://www.tc601.com/white-paper/665e937382296816d9090600
[10]杭州玳数科技有限公司(简称袋鼠云).数据治理行业实践白皮书(2023) [R/OL]. https://www.dtstack.com/resources/1001src=bbs