白城市农村居民乳腺癌发病风险预测模型的构建
尹婷 吴雪
白城医学高等专科学校 吉林白城 137000
1 通讯作者
随着医疗信息技术的快速发展,特别是大数据、机器学习和人工智能技术的广泛应用,构建乳腺癌发病风险预测模型已成为可能 [1]。这些模型不仅有助于提高乳腺癌的早期诊断率,还能为临床决策提供有力支持,从而改善患者的生活质量,降低死亡率[2]。白城市作为东北地区的重要城市,其农村居民的乳腺癌发病情况同样值得关注。本研究旨在利用医学信息学方法,结合白城市农村居民的实际情况,构建基于多源数据的乳腺癌发病风险预测模型,为当地乳腺癌的防治工作提供科学依据 [3]。
1. 资料与方法
1.1 一般资料
对白城市农村居民乳腺癌发病风险因素进行分析,构建风险预测模型。1.2 方法
本研究按照 1:1 匹配的原则,以年龄( ±2 岁)为匹配因素,选取经病理确诊的乳腺癌农村患者为病例组,选取 195 名经乳腺检查,结果为非乳腺癌的农村居民为对照组。采用文献回顾法,查阅国内外文献,咨询乳腺外科、流行病学等有关专家,制定《一般资料调查表》,用于评估吉林市农村居民乳腺癌危险因素,调查的内容主要包括:(1)基本情况:年龄、身高、体重、文化程度、职业、婚姻状况、家庭人均月收入、新农合和养老保险及就医延迟情况等。(2)生理情况:首次月经年龄、月经周期、痛经、绝经、行经天数、生育次数、怀孕次数、初产年龄、流产次数、母乳喂养、药物避孕情况等。(3)既往病史情况:乳腺良性疾病史、乳腺癌家族史等。(4)生活方式情况:吸烟、被动吸烟、饮酒、饮茶、饮咖啡、睡眠时间、熬夜、失眠、睡眠总体满意度、体育锻炼、穿胸罩睡觉、穿较紧的胸罩、日常饮用水来源。(5)饮食情况:三餐规律、饮食口味、各类食物饮食频率等。(6)环境情况:农药接触史、居住地附近污染源等。(2)激惹、抑郁和焦虑量表(Irritabilitiy,Depression and Anxiety Scale,IDA)激惹、抑郁和焦虑量表(IDA)由 Snaith 等于 1978 年研制,用于负性情绪的评估。该量表由抑郁(条目 1、3、5、9、12)、焦虑(条目 2、7、10、14、17)、内向激惹(条目 8、11、15、18)和外向激惹(条目 4、6、13、16)四个维度组成,一共 18 个条目。量表得分范围为 0-54 分,分数越高,表明负性情绪水平越高。在抑郁维度,0-3 分为正常、4-6 分为临界值、7-15 分为严重;在焦虑维度,0-5 分为正常、6-8 分为临界值、9-15 分为严重,在内向刺激方面,0-3 分为正常、4-6 分为临界值、7-12 分为严重,在外向刺激方面,0-4 分为正常、5-7 分为临界值、8-12 分为严重。
(3)乳腺癌预防知识 - 态度 - 行为问卷。乳腺癌预防知识 - 态度 -行为问卷由区洁霞 [50] 编制,包括乳腺癌预防知识问卷、乳腺癌态度及信念问卷、乳腺癌预防行为情况问卷。乳腺癌预防知识问卷包括乳腺癌基本知识、危险因素和早期筛查知识三方面,共 20 个问题,计 20 分,答案分为对与错,得分达满分 60% 为及格。问卷 Cronbach’α 系数为 0.877,重测信度系数为 0.875,各维度内容效度指数(I-CVI)为 0.846-0.921。本研究在考虑本地区调查实际情况和调查对象特点的基础上,对问卷进行了合理的修改,在进行预调查后测得问卷Cronbach’ ∝ 系数为 0.792。
1.3 统计学方法
通过 SPSS 26.0 软件进行数据录入和统计学分析。本研究对病例组和对照组的各乳腺癌危险因素分析采用单因素分析,对单因素分析筛选出来的有统计学意义的危险因素采用二元 Logistic 回归分析进行多因素分析,P<0.05 为差异具有统计学意义。
2. 结果
白城市农村居民的发病危险因素包括年龄、初潮年龄、避孕药、乳腺癌家族史、焦虑、乳腺炎病史。模型评价本研究模型ROC 曲线下面积为0.9,最佳临界值为 0.228,灵敏度为 58.9% ,特异度为 95.3% 。本模型预测乳腺癌发病的正确率为 76% ,乳腺癌不发病的正确率为 90% ,全组正确率为87.8%⨀ 。(见图1,表1)。


表1 本研究模型模型ROC 曲线下面积
3. 讨论
乳腺癌作为女性最常见的恶性肿瘤之一,其发病率在全球范围内持续上升,对女性健康构成了严重威胁 [4]。白城市农村居民由于经济条件、医疗资源等方面的限制,乳腺癌的早期发现和诊断率相对较低,导致病情恶化,治疗难度加大。
基于上述危险因素,我们构建了白城市农村居民乳腺癌发病风险预测模型。该模型通过整合患者的临床数据、生活习惯以及家族病史等多源信息,利用先进的机器学习和数据挖掘技术,实现了对乳腺癌发病风险的准确预测。经过验证,该模型对乳腺癌的发病具有良好的预测效能。其预测准确率、灵敏度、特异度等指标均达到了较高水平,为临床决策提供了有力支持。该模型不仅可以用于乳腺癌的早期筛查和诊断,还可以为制定针对性的干预措施提供参考。通过模型分析,我们可以识别出高危人群,从而采取更加有效的预防措施,降低乳腺癌的发病率和死亡率[5]。
尽管该模型在预测乳腺癌发病风险方面取得了显著成效,但仍存在一定的局限性。例如,模型可能受到数据质量、样本量等因素的影响,导致预测结果存在一定的误差。此外,模型还需要不断更新和优化,以适应新的临床数据和研究成果。
综上所述,白城市农村居民的发病危险因素包括年龄、初潮年龄、避孕药、乳腺癌家族史、焦虑、乳腺炎病史,建立的风险预测模型对乳腺癌的发病具有良好的预测效能。
参考文献:
[1] 陈晓冬 , 赵晶晶 , 徐宝成 , 等 . 反式脂肪酸摄入量与乳腺癌发病风险的 Meta 分析 [J]. 中国食品学报 ,2023,23(4):490-502.
[2] 周亮 , 王月 , 田凌嘉 , 等 . 不同机器算法在乳腺癌发病风险预测模型中使用效果的评估 [J]. 中医药信息 ,2023,40(8):23-28.
[3] 靳育静 , 高鹰 , 张卿 .Gail 模型在我国女性乳腺癌发病风险预测中的研究 : 系统综述与 Meta 分析 [J]. 现代肿瘤医学 ,2022,30(6):7.
[4] 解云涛 , 孙洁 , 姚璐 , 等 . 预测 BRCA 突变患者对侧乳腺癌发病风险的模型及应用 :CN202210496326.2[P].CN202210496326.2[2024-10-27].
[5] 刘开拓 , 易立岩 , 郝梓旭 . 乳腺癌相关风险因素及其防治措施的研究进展 [J]. 进展 : 科学视界 ,2023(7):183-185.
课题来源:白城市指导性科技发展计划项目
课题名称:白城市农村居民乳腺癌发病风险预测模型的构建
课题编号:BYSK202209