缩略图

利用机器学习预测钙钛矿型光催化材料的光吸收性能

作者

苏尧 廖潘兴 谢皇长 韦兰香

南宁学院 智能制造学院 广西南宁 541699

摘要:钙钛矿型光催化材料在光催化分解水制氢领域具有巨大的应用潜力。本研究聚焦于利用机器学习方法预测钙钛矿型光催化材料的光吸收性能。通过对钙钛矿材料的结构特征、化学组成等多方面数据的收集与分析,构建3种合适的机器学习模型,分别是支持向量机、随机森林或深度学习中的多层神经网络模型,模型从836个钙钛矿数据中筛出10种光催化材料,为钙钛矿型光催化材料的研发与优化提供理论支持。

关键词:钙钛矿型光催化材料;光吸收性能;机器学习;预测

一、引言

随着环境与能源问题的日益严峻,光催化技术作为一种可持续的环境净化和能源转换技术受到了广泛的关注。钙钛矿型光催化材料因其独特的晶体结构和优异的光电性能,成为光催化分解水制氢领域的研究热点之一[1]。传统的实验方法在研究钙钛矿型光催化材料的光吸收性能时,往往面临着耗时、费力且成本高昂等问题。机器学习作为一种强大的数据处理和分析工具,为预测钙钛矿型光催化材料的光吸收性能提供了一种新的途径。

二、钙钛矿型光催化材料概述

钙钛矿型化合物的通式为ABX3,其中A和B为不同的阳离子,X为阴离子。在光催化领域,常见的钙钛矿型光催化材料因其独特的晶体结构表现出良好的光吸收范围、较高的电荷载流子迁移率和较长的载流子寿命等优点[2]。化合物的带隙范围通常是决定材料光催化分解水制氢的重要因素,经实验和理论计算表明,一般在1.9~3.0eV是最为合适。通常,较大的A位阳离子会导致晶格膨胀,进而影响B-X键的强度和电子态分布,使带隙变窄或变宽[3]。通过合理控制合成条件,可以优化缺陷类型和浓度,减少不利影响,甚至利用特定缺陷增强光吸收能力,为设计高效钙钛矿型光催化材料提供了重要指导方向。

三、机器学习在材料性能预测中的应用

对于钙钛矿型光催化材料的光吸收性能预测,常用的机器学习算法包括神经网络、支持向量机、随机森林以及梯度提升决策树等。这些算法可以基于钙钛矿材料的结构和组成特征(如晶体对称性、离子半径、电负性、带隙宽度等)作为输入,以光吸收性能指标(如吸收系数、吸收边位置、量子效率等)作为输出进行模型的构建和训练。深度学习方法,例如卷积神经网络(CNN)和图神经网络(GNN),也被用于处理复杂的晶体结构数据。通过将物理化学知识融入机器学习模型(如引入先验约束或理论计算结果),可为高效钙钛矿型光催化材料的设计提供有力支持。

四、基于机器学习的钙钛矿型光催化材料光吸收性能预测

4.1 数据收集

收集钙钛矿型光催化材料的数据是预测其光吸收性能的基础,需涵盖多方面内容。一方面,应详细记录元素组成,包括A位、B位阳离子及X位阴离子种类,并分析其对晶体结构的影响;另一方面,晶体结构参数(如晶格常数、晶胞体积、对称性等)以及微观形貌特征(如颗粒尺寸、比表面积)同样关键。制备工艺参数(如合成温度、时间、前驱体浓度)会显著影响材料的最终性质,也需系统整理。这些数据来源于已发表的文献、公开的材料数据库(如Materials Project、AFLOW),通过实验室自行测量获得,确保数据的准确性和多样性。

4.2 特征工程

对收集到的数据进行特征工程处理,选择与光吸收性能密切相关的特征作为模型的输入。通过主成分分析或递归特征消除等特征选择方法,去除冗余信息,降低数据维度;再利用特征提取技术,如生成描述符或嵌入表示,进一步增强特征的表达能力,从而显著提高模型的预测效率和准确性。

4.3 模型构建与训练

选择3种机器学习算法构建预测模型,分别是支持向量机、随机森林或深度学习中的多层神经网络模型。将经过特征工程处理的数据按约7:3的比例分为训练集和测试集。通过网格搜索与交叉验证等方法调整超参数,优化模型结构,避免过拟合。随后,使用独立的测试集评估模型性能,采用平均绝对误差(MAE)、均方根误差(RMSE)、决定系数(R²)等指标全面衡量模型的预测能力与泛化水平。表1总结了3个模型的训练集评价函数的值,显然,3个模型在预测卤化物双钙钛矿的带隙表现良好。

4.4 模型优化与验证

根据模型在测试集上的表现,可采用多种策略对模型进行优化。调整神经网络的层数、神经元个数及激活函数类型等超参数,以改善模型架构;同时引入正则化方法(L1、L2正则化, Dropout 技术),有效防止过拟合现象的发生。经过优化后的模型需进行更严格的验证,采用 k 折交叉验证或留出法等手段,全面评估其稳定性和泛化能力,确保在不同数据分布下的预测准确性与可靠性。首先,采用元素替位法生成836个钙钛矿数据,对初始数据进行初筛。然后选择容忍因子范围在 0.8~1.2的钙钛矿以确保其形成稳定结构,将初筛后的数据代入到模型,结合模型预测结果,将带隙范围锁定在1.9~3.0eV,最终,筛选出10种高性能钙钛矿光催化材料如表2所示。

五、结果与讨论

5.1 预测结果分析

对比3个模型对带隙的预测结果,多层神经网络表现最好(R²=0.9026,MAE=0.0473)。支持向量机表现最差,这可能与它很大程度上依赖于核函数的选择和参数的设置有关,不同的核函数和参数会对模型性能产生显著影响。经模型预测,KIrI3、CsNbI3、RbYI3、TlSbI3、RbCuBr3、TlAsBr3、CsSbBr3、RbInBr3、CsCoI3、CsInBr3等材料的带隙范围处于光催化分解水理想带隙范围之内,与实验数据基本相符。表明模型不仅具有较高的准确性,还展现出良好的泛化能力。这为后续材料设计和性能优化提供了可靠的理论支持。

5.2影响因素分析

通过对模型的分析,可以深入了解影响钙钛矿型光催化材料光吸收性能的关键因素。占据 B位的元素主要为 Cu、Y、Ir、Co、Sb、In、Nb、As 等元素,其电负性与电离能分布范围较大,采用这些元素合成钙钛矿材料,为优化材料的光吸收性能提供了理论依据。卤素为 Br、I 的结构更适合作为带隙在1.8~3.1eV的光催化材料,卤素为 Cl 的结构较少,故 X 位基本为 Br和 I 元素。晶体结构中的特定结构与光吸收性能之间存在着复杂的关联,这有助于进一步理解光吸收的微观机制。

六、结论与展望

6.1 结论

本研究成功地利用机器学习方法构建了预测钙钛矿型光催化材料光吸收性能的模型,筛出10种高效光催化材料。通过数据收集、特征工程、模型构建与训练以及优化验证等步骤,得到了具有较理想的预测模型。该模型能够为钙钛矿型光催化材料的光吸收性能预测提供有效的手段,有助于加速钙钛矿型光催化材料的研发进程。

6.2展望

尽管本研究取得了一定的成果,但在仍有许多工作需要开展。需要进一步扩大数据来源,提高数据的多样性和准确性,以提高模型的泛化能力;探索更先进的机器学习算法,以更好地处理复杂的材料性能预测问题;深入研究光吸收性能与材料微观结构之间的内在联系,为基于机器学习的材料设计提供更坚实的理论基础。

参考文献

[1] 冯尉强.钙钛矿型太阳能电池及水裂解电催化材料性能研究与新材料设计[D].吉林:吉林大学,2022.

[2]万新阳.基于机器学习算法的钙钛矿氧化物全解水光催化剂的高效筛选[D].江苏:东南大学,2022.

[3]邓钦.基于机器学习的钙钛矿材料性能研究[D].四川:电子科技大学,2021.

基金项目:南宁学院2023年校级科研项目“基于机器学习的光催化材料结构及性能预测”(南院科研〔2023〕20号)