基于网络熵预警结直肠癌恶化的临界点
佘承穆 唐植锐 钟佳元
佛山大学 数学学院 广东佛山 528000
摘要 结直肠癌的发展可分为三个不同的阶段:相对正常状态、临界状态和疾病状态。相对正常状态下,病情进展缓慢,处于相对稳定且可控的阶段。临界状态则是疾病恶化前的短暂窗口期,一旦跨越此阶段,病情将迅速恶化。因此,需要开发一种有效的方法来识别这一临界期或预恶化阶段,以便及时采取适当措施防止病情进一步恶化。本研究提出了一种基于网络熵的计算方法,用于预测结直肠癌的预恶化阶段或临界点。
关键词:网络熵 结直肠癌 临界点
一、引言
根据世界卫生组织2020年发布的全球癌症数据,我国结直肠癌的发病率和死亡率在恶性肿瘤中分别位居第二和第五[1]。临床上,结直肠癌通常分为四个阶段:I期、II期、III期和IV期。对于早期结直肠癌(I期和II期)患者,五年生存率可达到80%左右。因此,早期的诊断和及时的治疗对于提高患者的生存率至关重要。然而,早期结直肠癌的症状和体征往往不明显,难以被及时发现,导致许多患者确诊时已处于晚期,错过了根治的机会[2]。因此,提高结直肠癌治疗效果的关键在于识别癌症恶化的预警信号,提前预测疾病的临界恶化状态。结直肠癌的发展过程大致可分为三个不同状态[3]:相对正常状态、临界点和疾病状态。在恶化临界状态之前,疾病通常没有明显的临床症状,难以及时发现和诊断。因此,对结直肠癌恶化临界点分析是当前复杂疾病研究领域面临的一大挑战[4]。
目前,面对海量的生物医学数据,亟需发展能够从高维数据中挖掘动态信息的理论和计算方法,从复杂的高维分子组学数据中提取有效的疾病信息,特别是识别潜在的健康临界变化及预警信息,这对于结直肠癌的早期诊断、预防和治疗具有重要意义[5]。本文提出了一种基于网络熵的计算方法,用于识别结直肠癌的预恶化阶段或临界时期(如图1所示)。该方法能够为每个时期计算一个预警评分,当评分出现上升时,即标志着疾病即将进入恶化的临界点。我们已将该方法应用于TCGA数据库中的结直肠癌(COAD)真实数据,结果表明,该方法能够准确探测到疾病的预恶化时期或临界点。
二、 分析结果
为了验证网络熵方法在检测肿瘤疾病早期恶化预警信号中的有效性,我们将该方法应用于癌症基因组图谱中的结直肠癌数据。根据本文提出的网络熵方法计算每个肿瘤样本的网络熵值。在各个阶段,通过样本的平均网络熵值来定量评估结直肠癌的早期恶化。
我们将所提出的网络熵方法应用于TCGA数据库中的结直肠癌(COAD)。通过该方法的分析,我们发现结直肠癌的临界点出现在I期(见图2A)。为了验证临界点的识别效果,我们通过Kaplan-Meier(log-rank)生存分析展示并比较了转变前后样本的预后结果。具体而言,相较于转变后阶段的样本,转变前阶段的样本通常具有更长的预后效果(见图2B)。这些结果表明,我们提出的网络熵计算方法能够有效地预测结直肠癌恶化前的早期预警信号。
三、 结论
对于大多数复杂疾病来说,提前识别疾病恶化的预警信号至关重要。然而,生物医学数据的复杂性和高维度在临床和实验中普遍存在,常常导致许多传统统计方法的失效。因此,迫切需要开发新的方法来解决上述问题。本研究提出了一种基于网络熵的指标,能够在网络层面上识别结直肠癌出现明显临床症状前的临界状态。具体来说,我们的方法已应用于TCGA数据库中的结直肠癌恶化临界点,结果显示其能够有效捕捉疾病恶化临界转变的预警信号。
本文提出的基于网络熵的计算方法具有以下两大优势。首先,我们的研究重点在于识别结直肠癌恶化的临界状态,并挖掘能在癌症恶化临界期发出警示的动态网络标志物,而非寻找用于诊断结直肠癌的生物标志物,这与以往的研究不同。其次,这是一种无模型的方法,意味着网络熵方法无需进行特征选择或模型/参数训练。综上所述,我们提出了一种全新的计算方法,有助于在网络层面研究疾病进展,并提供对肿瘤预恶化阶段的预测。
参考文献
[1] 刘宗超, 李哲轩, 张阳, 等. 2020 全球癌症统计报告解读[J]. 肿瘤综合治疗电子杂志, 2021, 7(2): 1-13.
[2] 李道娟, 李倩, 贺宇彤. 结直肠癌流行病学趋势[J]. 肿瘤防治研究, 2015, 42(03): 305-310.
[3] Chen L, Liu R, Liu ZP, Li M, Aihara K. Detecting early-warning signals for sudden deterioration of complex diseases by dynamical network biomarkers. Sci Rep. 2012; 2:342.
[4] Strickler JH, Loree JM, Ahronian LG, Parikh AR, Niedzwiecki D, Pereira AAL, McKinney M, Korn WM, Atreya CE, Banks KC, Nagy RJ, Meric-Bernstam F, Lanman RB, Talasaz A, Tsigelny IF, Corcoran RB, Kopetz S. Genomic Landscape of Cell-Free DNA in Patients with Colorectal Cancer. Cancer Discov. 2018; 8(2):164-173.
[5] Dai H, Jin QQ, Li L, Chen LN. Reconstructing gene regulatory networks in single-cell transcriptomic data analysis. Zool Res. 2020; 41(6):599-604.