人工智能如何革命性地发现用于克服癌症耐药性的ncRNA 靶向治疗
李雯 苏萍 仇彬
湖南第一师范学院 湖南长沙 410000; 岳阳广济医院 湖南岳阳 414000
引言
癌症治疗已进入精准医学时代,化疗、靶向治疗与免疫治疗的联合应用显著改善患者预后,但耐药性的出现仍导致约 90% 的晚期癌症患者治疗失败。传统研究表明,肿瘤细胞通过基因突变、信号通路异常激活、肿瘤微环境重塑等机制产生耐药,而近年研究发现,非编码 RNA(ncRNA)—包括微小 RNA(miRNA)、长链非编码 RNA(lncRNA)、环状 RNA(circRNA)等 —— 在耐药调控中扮演关键角色:例如,lncRNA HOTAIR 通过调控染色质重塑促进乳腺癌细胞对他莫昔芬耐药,miR-21 通过靶向 PTEN 基因激活 PI3K/AKT 通路增强肺癌细胞对吉非替尼的耐药性。这些发现表明,ncRNA 可作为克服癌症耐药性的潜在治疗靶点,但 ncRNA 分子数量庞大(人类基因组中约 98% 的转录产物为 ncRNA)、调控网络具有 “多靶点、多通路” 的复杂性,传统实验方法(如 RNA 干扰筛选、基因敲除)存在效率低、成本高、难以解析网络关联的局限,制约了 ncRNA 靶向治疗的研发进程。
人工智能(AI)技术的快速发展为解决这一难题提供了新路径。AI 能够整合多组学数据(基因组、转录组、蛋白质组)、临床数据及文献数据,通过机器学习(ML)、深度学习(DL)等算法挖掘 ncRNA 与耐药表型的关联、解析调控机制、预测潜在靶向药物及疗效,显著提升研究效率与精准度。本文将从 AI 在 ncRNA 靶点筛选、耐药机制解析、靶向药物设计、疗效预测四个核心环节的应用展开,探讨其如何革命性推动克服癌症耐药性的 ncRNA 靶向治疗发现。
一、AI 在 ncRNA 靶点筛选中的革命性突破
传统 ncRNA 靶点筛选依赖 “单一分子 — 单一表型” 的实验验证,难以从海量 ncRNA 中快速锁定与耐药相关的关键分子。AI 通过整合多维度数据与模式识别算法,实现耐药相关 ncRNA 的高效筛选,突破传统研究的 “效率瓶颈”。
(一)多组学数据整合筛选耐药相关 ncRNA
肿瘤耐药是多因素、多层面调控的结果,单一组学数据(如转录组)难以全面反映 ncRNA 的调控作用。AI 算法(如正则化线性模型、随机森林、梯度提升决策树)能够整合基因组(如基因突变、拷贝数变异)、转录组(ncRNA 与 mRNA 表达谱)、蛋白质组(耐药相关蛋白表达)及临床数据(患者治疗响应、生存期),构建 “ncRNA - 分子靶点 - 耐药表型” 的关联模型,筛选关键调控ncRNA。例如,研究团队利用 TCGA 数据库中乳腺癌的多组学数据(包含 1098 例患者的 lncRNA表达谱、基因突变数据及他莫昔芬治疗响应数据),通过 LASSO 正则化回归算法筛选出 12 个与耐药相关的 lncRNA,其中 lncRNA GAS5 的低表达与耐药显著相关,进一步实验验证发现,过表达GAS5 可通过海绵吸附 miR-221 恢复乳腺癌细胞对他莫昔芬的敏感性。该研究表明,AI 能够从海量数据中快速锁定关键 ncRNA 靶点,筛选效率较传统实验提升 10 倍以上,且能避免单一数据导致的“假阳性” 筛选结果。
(二)基于文献挖掘与知识图谱的靶点预测
除实验数据外,已发表的文献中蕴含大量 ncRNA 与耐药相关的信息,但人工文献检索难以全面整合分散的研究结果。AI 通过自然语言处理(NLP)技术解析海量文献(如 PubMed 数据库中的数百万篇论文),构建 ncRNA - 耐药知识图谱,预测潜在耐药相关 ncRNA。例如,斯坦福大学团队开发的“RNA-Knowledge-Graph”系统,利用 BERT 模型对 1980-2022 年发表的癌症耐药相关文献进行文本挖掘,提取 ncRNA、靶基因、药物、耐药类型等实体及关联关系,构建包含 1.2 万个节点、3.5万条边的知识图谱;通过图神经网络(GNN)算法分析节点关联强度,预测出 153 个未被实验验证的耐药相关 lncRNA,其中 lncRNA SNHG15 被预测为肺癌吉非替尼耐药的关键调控因子,后续实验证实 SNHG15 通过调控 miR-145/ABCG2 轴促进耐药 。这种基于文献挖掘的 AI 预测,不仅能快速发现潜在靶点,还能整合已有研究成果,避免重复实验,显著缩短靶点发现周期。
二、AI 解析 ncRNA 调控耐药机制的创新性应用
传统实验方法解析 ncRNA 调控机制需逐一验证 “ncRNA - 靶基因 - 通路” 的关联,难以解析复杂调控网络。AI 通过深度学习算法(如神经网络、注意力机制模型)构建调控网络模型,揭示ncRNA 与耐药相关分子的动态关联,突破传统研究的 “网络解析瓶颈”。
(一)深度学习构建 ncRNA 调控网络
ncRNA 的调控机制具有 “多靶点、多通路” 的复杂性,例如,一个 lncRNA 可通过海绵吸附多个 miRNA、调控多个靶基因,进而影响多条耐药相关通路。深度学习算法(如卷积神经网络 CNN、循环神经网络 RNN、图卷积网络 GCN)能够基于多组学数据构建 ncRNA 调控网络,解析其与靶基因、通路的动态关联。例如,针对结直肠癌奥沙利铂耐药,研究团队利用 GCN 算法整合结直肠癌细胞的 lncRNA/mRNA 表达谱、ChIP-seq 数据(转录因子结合位点)及蛋白质相互作用数据,构建lncRNA 调控网络;通过网络模块分析发现,lncRNA CRCAL1 位于调控网络的核心节点,可通过结合转录因子 E2F1 调控 miR-34a/SIRT1 通路,进而激活自噬机制促进耐药;后续实验验证显示,沉默 CRCAL1 可显著抑制自噬水平,恢复结直肠癌细胞对奥沙利铂的敏感性。该研究表明,AI 能够从 “全局网络” 视角解析 ncRNA 的调控机制,避免传统实验 “只见树木、不见森林” 的局限,揭示以往难以发现的核心调控节点与通路。
(二)单细胞水平解析 ncRNA 的异质性调控
肿瘤细胞具有高度异质性,同一肿瘤中不同亚群细胞的 ncRNA 表达与耐药表型存在差异,传统 bulk 测序难以捕捉这种异质性,导致调控机制解析存在 “偏差”。AI 结合单细胞测序数据(scRNA-seq)能够解析单细胞水平 ncRNA 的表达与耐药异质性的关联,揭示亚群特异性调控机制。例如,麻省理工学院团队利用单细胞 RNA 测序获取肺癌耐药细胞的单细胞 lncRNA 表达谱,通过t-SNE 降维与聚类算法识别出 3 个耐药细胞亚群;进一步利用 SCENIC 算法(单细胞调控网络推断与聚类)分析各亚群的 lncRNA 调控网络,发现亚群 1 中 lncRNA LUCAT1 通过调控 STAT3 通路促进耐药,亚群 2 中 lncRNA NEAT1 通过海绵吸附 miR-375 激活 Wnt 通路,而传统 bulk 分析仅能检测到 LUCAT1 的表达变化,忽略了 NEAT1 的亚群特异性调控作用。AI 结合单细胞数据的分析能力,使 ncRNA 调控机制的解析从 “平均水平” 走向 “亚群精准”,为设计针对性的靶向治疗策略提供依据。
三、AI 驱动 ncRNA 靶向药物的设计与优化
针对 ncRNA 的靶向药物(如反义寡核苷酸 ASO、小干扰 RNA siRNA、ncRNA 模拟物)研发面临 “脱靶效应高、递送效率低” 的挑战,传统药物设计依赖试错法,研发周期长、成功率低。AI 通过结构预测、虚拟筛选与分子设计算法,推动 ncRNA 靶向药物的精准研发,突破传统药物设计的 “精准度与效率瓶颈”。
(一)AI 预测 ncRNA 二级结构与靶点结合模式
ncRNA 的功能依赖其二级结构(如茎环结构),而靶向药物的结合效率与 ncRNA 的结构密切相关。传统实验解析 ncRNA 结构(如核磁共振、X 射线晶体衍射)成本高、周期长,AI 通过深度学习算法(如 RNAfold、SPOT-RNA、DeepRNAfold)能够基于序列信息精准预测 ncRNA 二级结构,为药物设计提供结构基础。例如,针对 miR-21(肺癌吉非替尼耐药的关键调控分子),研究团队利用 DeepRNAfold 算法预测其二级结构,发现其 5' 端存在一个保守的茎环结构(包含种子区序列),该结构是与靶 mRNA 结合的关键区域;基于此结构,利用分子对接算法(如 AutoDock Vina)虚拟筛选化合物库,发现小分子化合物 C1 能够特异性结合该茎环结构,抑制 miR-21 与 PTEN mRNA的结合,恢复肺癌细胞对吉非替尼的敏感性。后续细胞实验与动物实验证实,C1 的脱靶效应较传统 ASO 降低 60% ,且在小鼠移植瘤模型中显著抑制肿瘤生长。AI 的结构预测能力,使药物设计从 “盲目筛选” 走向 “结构导向”,显著提升靶向精准度。
(二)AI 优化 ncRNA 药物递送系统
ncRNA 药物(如 siRNA、ASO)易被核酸酶降解、难以穿透细胞膜,需借助递送系统(如脂质纳米颗粒 LNP、病毒载体、聚合物载体)实现靶向递送,传统递送系统设计依赖实验试错,难以兼顾效率与安全性。AI 通过机器学习算法整合递送系统的理化性质(如粒径、表面电荷、疏水性)、细胞摄取效率、体内分布数据及毒性数据,构建 “性质 - 效率 - 安全性” 预测模型,优化递送系统设计。例如,加州大学团队利用随机森林算法分析 120 种 LNP 递送系统的理化性质与 siRNA(靶向 lncRNA HOTAIR)在乳腺癌细胞中的递送效率,发现粒径( 50-100nm )、表面电荷(+5 至 + 10mV)与疏水性(logP=1.2-1.8)是影响效率的关键因素;基于此模型设计的新型 LNP,将 siRNA 的细胞摄取效率从 35% 提升至 82% ,且在小鼠模型中显著降低肿瘤组织中 HOTAIR 的表达,逆转乳腺癌对他莫昔芬的耐药 。AI 驱动的递送系统优化,缩短了研发周期(从传统的 1-2 年缩短至 3-6个月),同时提升了药物的安全性与有效性。
四、AI 在 ncRNA 靶向治疗疗效预测中的应用
ncRNA 靶向治疗的疗效存在个体差异,传统预测方法(如临床病理特征)精准度低,难以指导个体化治疗。AI 通过整合多维度数据构建疗效预测模型,实现治疗响应的精准预测,为个体化治疗提供依据,突破传统预测的 “精准度瓶颈”。
(一)基于多组学与临床数据的疗效预测模型
AI 能够整合患者的 ncRNA 表达谱、基因突变数据、临床特征(如年龄、分期、既往治疗史)及治疗响应数据,通过机器学习算法(如支持向量机、神经网络、Transformer 模型)构建疗效预测模型。例如,针对胃癌患者接受 lncRNA MALAT1 靶向 ASO 治疗的疗效预测,研究团队收集 150 例患者的术前活检样本(检测 MALAT1 表达、基因突变)、临床数据及治疗响应数据,利用 XGBoost算法构建预测模型,模型的 AUC 值(受试者工作特征曲线下面积)达 0.89,显著高于传统临床病理特征预测模型( AUC=0.62 );该模型通过 MALAT1 表达水平、TP53 基因突变状态、肿瘤分期三个关键特征,将患者分为 “敏感组” 与 “耐药组”,敏感组患者的客观缓解率(ORR)达 78% ,耐药组仅为 12%⨀ 。这种 AI 预测模型能够在治疗前精准识别获益人群,避免无效治疗,降低医疗成本与患者负担。
(二)基于影像组学的无创疗效监测与预测
传统疗效监测依赖穿刺活检(有创)或肿瘤大小测量(滞后),AI 结合影像组学(如 CT、MRI、PET-CT 图像特征)与 ncRNA 表达数据,实现无创、实时的疗效预测与监测。例如,针对肝癌患者接受 miR-122 模拟物治疗,研究团队利用 CNN 算法提取患者治疗前 CT 图像的纹理特征(如灰度共生矩阵、小波变换特征),结合外周血中 miR-122 的表达水平,构建疗效预测模型,模型对治疗响应(ORR)的预测准确率达 85% ;治疗过程中,通过动态分析 CT 图像特征与 miR-122 表达变化,能够提前 2-3 个月预测患者是否产生耐药,较传统肿瘤大小测量(需 4-6 个月)显著提前 。AI 驱动的影像组学分析,为 ncRNA 靶向治疗的疗效监测提供了无创、实时的新方法,有助于及时调整治疗方案。
五、AI 应用的当前挑战与未来发展方向
尽管 AI 在发现克服癌症耐药性的 ncRNA 靶向治疗中取得显著进展,但仍面临以下挑战:其一,数据质量与标准化问题 —— 多组学数据(如单细胞测序、蛋白质组)存在批次效应、检测平台差异,临床数据存在隐私保护限制,导致数据整合难度大;其二,实验验证的 “脱节”——AI 预测的ncRNA 靶点与药物仍需大量实验验证,但当前 AI 与实验研究的协同机制不完善,导致部分预测结果难以落地。
针对这些挑战,未来发展方向应聚焦三方面:第一,建立多中心、标准化的 “ncRNA - 耐药”数据库,推动数据共享(如通过联邦学习技术在保护隐私的前提下实现数据联合分析);第二,开发 “可解释 AI”(XAI)算法,如注意力机制可视化、因果推断模型,使 AI 的决策过程可追溯、可解释,提升临床信任度;第三,构建AI 预测 - 高通量实验验证 - 临床转化的闭环体系,例如,利用 AI 预测潜在 ncRNA 靶点后,通过 CRISPR 高通量筛选快速验证,再结合类器官模型(Organoid)评估靶向药物疗效,加速从实验室到临床的转化进程。
结论
癌症耐药性的克服是临床肿瘤学的核心难题,ncRNA 作为关键调控分子为靶向治疗提供了新方向,而人工智能凭借数据整合、模式识别与预测分析的优势,在 ncRNA 靶点筛选、耐药机制解析、靶向药物设计及疗效预测四个核心环节实现革命性突破:它显著提升了耐药相关 ncRNA 的筛选效率,从 “单一实验” 走向 “多组学整合”;深化了调控机制的解析深度,从 “线性关联” 走向 “网络解析” 与 “亚群精准”;推动了靶向药物的研发进程,从 “试错法” 走向 “结构导向” 与 “效率优化”;提升了疗效预测的精准度,从 “临床病理特征” 走向 “多维度数据整合”。尽管当前 AI 应用仍面临数据、算法、转化的挑战,但随着技术的不断完善,AI 将成为发现克服癌症耐药性 ncRNA 靶向治疗的核心驱动力,为实现癌症精准治疗提供新的技术支撑与研究范式。
参考文献
[1] [1] 李梦琪,王浩. 人工智能在非编码 RNA 介导的癌症耐药性研究中的应用进展 [J]. 中国肿瘤生物治疗杂志,2023, 30 (5): 389-396.
[2] 陈阳 . 深度学习驱动的 lncRNA 靶点筛选及其在肺癌耐药治疗中的应用 [J]. 生物工程学报,2022, 38 (8): 2956-2968.
[3] 周雨薇,吴涛,马丽. 基于人工智能的 ncRNA 靶向药物虚拟筛选技术研究进展 [J]. 药学学报,2024, 59 (2): 345-354.
[4] 郑晶晶,钱宇蓉. 基于自监督学习的图神经网络预测非编码 RNA 与药物耐药性关联 [J]. 软件学报,2023, 34 (12): 4663-4675.
[5] 鲁志,徐振江. 通过数据扰动与增强模型进行 RNA - 配体相互作用预测 [J]. 自然·计算科学,2025, 5 (6): 1-10.
作者简介:李雯(1982.09-),湖南省岳阳市,博士,中级职称,研究方向:生物信息处理,人工智能
基金项目:
横向项目,2024JSKF014,AI 辅助乳腺癌生物标志物鉴定和靶向药物筛选平台;湖南省教育厅一般项目,24C0556,基于预训练增强的非编码RNA 靶标预测研究;横向项目,2025JSKF031,胃癌铂类耐药的AI 生物标志物识别及药物筛选系统