基于卷积神经网络的余震预测

摘要：地震预测是一项艰巨的任务。地震受限于特定的时空范围，仅是一种概率事件。在大范围内，基于已发生的地理事件来预测地震是可靠的。本文的研究内容是在主震已发生的情况下预测余震的持续时间。我们从地震相数据中提取了6个特征来预测余震期，从1351个数据中筛选出855个数据，并对网络进行了训练。训练验证的准确率达到90%，测试准确率达到100%。

关键词：卷积神经网络；余震预测；地震预测

1.引言

地震是一种随机事件。大量的地震事件留下了丰富的观测数据。凭借我们对自然规律的理解，我们或许能够从大数据中识别出地震的模式。Cattania等人认为，在研究中不能将地震视为孤立事件。为了研究地震在更大区域空间内发生的可能性，Chang Qing Li使用LSTM模型预测了实验室中花岗岩断裂实验中裂缝的位置和方向。Sehrish等人认为，神经网络可以表达地震发生迹象与概率之间的映射关系。他们使用BAT-ANN网络来避免算法陷入局部最优解而错过全局最优解。Asmae等人根据地震的时间、地点和震级预测了地震的可能性。

在地震已经发生的前提下，可以预测余震期。显然，神经网络是目前可用的最佳工具。我们从一次地震的 2351个数据中选择了856个数据。为了使数据特征更加全面，我们从地震相数据块中选择了7个特征数据来形成输入向量。

2.相关工作

Helene等人[1]对地震预测进行了研究。早期，地震学家认为预测是地震研究的合理目标。在 20世纪的大部分时间里，人们对地震预测持乐观态度。随着资金流入地震学领域，它推动了预测研究走向结论。中国似乎已经成功预测了地震，这使得地震预测方法的发展迫在眉睫。地震学研究的目标是无障碍地进行预测，但应在合理和正确使用信息以及理解固有困难的前提下进行。公众对地震预测的反应表明，60-85%的人认为地震是可以预测的。Asmae Berhich等人[2]将智利地震数据集分为两类：大地震以及小地震。他们认为有四种方法可以预测地震，即前兆信号、统计算法、机器学习和深度学习。他们从地震数据集中选取了纬度、经度、深度、年、月、日、时、分、秒和震级作为 10 个特征参数。震级大于 5.0 的大地震被视为重大地震，而震级在 0.2 至 5.0 之间的地震则被视为小地震。通过构建一个包含 10 个神经元的 LSTM 网络，输出四个预测结果：震级、纬度、经度和年份。将输入数据归一化到 [0，1] 区间。将数据集的 80% 用于训练，20% 用于测试。实验结果使用平均绝对误差（MAE）和均方误差（MSE）进行评估。Saba Sehrish 等人 [3] 将地震预测分为三类：数理统计、人工智能和混合方法。将时间和地震信号输入到人工神经网络（ANN）中以预测地震震级。评估算法为平均绝对误差（MAE）和均方误差（MSE）。他们认为，不同的技术都可以预测地震。持续改进可以带来更准确的结果。在所有技术中，神经网络展现出更好的可能性。它可以实现输入和输出之间的复杂映射关系。将批量调整技术（BAT）算法添加到 ANN 中可以有效避免网络过拟合。常庆利等人 [4] 在实验室中对花岗岩进行了断裂试验。使用六个参数进行分析：干密度、统计摩擦系数、杨氏系数、总力、加载速率和剪切力。通过二维映射扫描仪获取数字图像。研究声波在花岗岩断裂过程中的传播特性。解释地震发生的机制。莫尔昌等人 [5] 认为，地震预测与评估并无标准方法。有必要对理论分析进行仔细审视。需要强调的一点是，基于预警机制的算法并不可靠。卡塔尼亚等人 [6] 提出，大地震的预测应在较大的时空尺度上进行研究。相对而言，小地震是由孤立凸体缓慢破裂引起的，而大地震则已经发生。这些断裂是周期性重复的，并且是可以预测的。他们从时空角度对地震预测进行了研究。Qianlong W 等人 [7] 构建了一个二维输入的长短时记忆网络（LSTM），以揭示历史地震的时空关系。他们将 LSTM 划分为若干小部分，以降低算法的复杂性。吉蒂斯等人 [8] 认为，密集的全球定位系统（GPS）接收站网络可以监测地球表面的运动。

上述文献表明，余震是可以预测的。神经网络是建立相应预测模型的最合适方法。

3.提出的方法

图 1：网络结构

使用前向传播网络，输入 RxQ1 矩阵。Q1 输入向量包含 R 个元素。输出是 SNxQ2 矩阵。Q2目标向量包含 SN 个元素。采用如图 1 所示的三层结构。隐藏层有 100 个神经元，输入层宽度为 7，输出层宽度为 4。传递函数分别采用 S 形变换函数 Logig 和双曲正切 S 形函数 transig。尽量避免使用线性函数。梯度下降函数采用 trainingdx，这是一种自适应学习率训练函数。输入层的权重由输入决定，隐藏层的权重可能来自输入层。每层的权重通过学习函数进行更新。训练由训练函数执行。性能通过性能函数进行测量。

图 2：训练状态

4.实验与结果

数据来源于中国地震台网中心和国家地震科学数据中心（http：//data.earthquake.cn）。我们选择了 2021 年 5 月 22 日 02：04 青海玛多 7.9 级地震相数据集中的地震相数据块 DPB。训练性能如图 3 所示。

图 3：训练性能

对原始数据进行筛选。选取 7 个特征。它们分别是：地震相到达时的相位、时间、走时残差 Resi、震中距离、台站方位角 Azi、振幅 Amp、震级 Mag_Val 和周期。由于日期均为同一天，因此仅记录小时、分钟和秒。为便于操作，我们从时间中减去初始时间，将偏移量作为时间特征值。

我们将数据集分为两个子集。80% 的数据集作为训练子集，20% 作为测试子集。输入数据如图4所示。

图 4：输入数据

训练完成后，我们使用新的数据集对模型进行测试。测试结果如图5所示。

图 5：测试结果

5.评估

从训练结果可以看出，内置的 trainingdx 训练函数对整个模型的输出值影响较大，导致出现显著误差，使得模型无法使用。除了输出约束和设置输出上限外，训练效果良好，近似效果也较好。这表明改进后的约束训练 dx 训练函数可以处理模型输出值过大或过小的情况，从而获得更好的结果。

通常，在样本量固定的情况下，用于评估点估计质量的标准总是点估计值与参数真值之间距离的函数。最常用的函数是距离的平方。由于估计具有随机性，可以求得该函数的期望值，即均方误差，由以下公式给出：

6.结论

在地震已经发生的前提下，预测余震的持续时间是可以实现的。根据不同地区的地质条件，可以建立相应的余震预警机制。基于现有地震，将预测范围扩大到更大区域和更长时段，预测未来地震也应是可行的。这是本文努力探索的方向。

地震预测并非本研究的目标。本研究旨在为地震救援提供数据支持。在地震发生时，应尽可能减少人员伤亡和财产损失。

参考文献：

[1]Helene J， Tiziana R， Caroline B， Cliodhna O， et al. Stigma in Science： The Case of Earthquake Prediction [J]. Disasters， 2018， 42（1）： 81-100.

[2]Asmae Berhich， Fatima-Zahra Belouadha， Mohammed Issam Kabbaj. Lstm-Based Models for Earthquake Prediction[C]. International Conference on Networking， 2020： 46：1-46：7.

[3]Saba Sehrish， Faraz Ahsan， Sajjad Mohsin. BAT-ANN based earthquake prediction for Pakistan region. [J]. Soft computing， 2017， 21（19）： 5805-5813.

[4]李长青，周小平. 实验地球预测 [J]. 地震预测模型， 2021， 160.

[5]G. Molchan， L. Romashkova， A. Peresan. On some methods for assessing earthquake predic¬tions[J]. Geophysical journal international， 2017， 210（3.0）： 1474-1480.

[6]C. Cattania， P. Segall. Crack Models of Repeating Earthquakes Predict Observed Moment Recurrence Scaling [J]. Journal of geophysical research. Solid earth， 2019， 124（1）： 476-503.

[7]吴倩龙，高一凡，杨李新.基于温度变化的地震预测模型[J]，现代地理探索， 2020， 8（1）： 148-158.

[8]Valeri Gitis， Alexander Derendyaev， Konstantin N. Petrov. Analyzing the Performance of Gps Datafor Earthquake Prediction [J]. Remote sensing， 2021， 13（9）： 1842.