缩略图
Science and Technology Education

基于产教融合的数据挖掘课程PBL 教学改革

作者

刘哲 刘苏卉 韩海 陈倍民

江汉大学 人工智能学院 湖北武汉 430056

1 引言

随着人工智能AI 技术的突飞猛进,数据挖掘作为其重要分支,正在深刻改变着多个学科领域的发展格局[1]。在我国科技创新战略中,大数据与人工智能技术被视为推动产业转型的重要引擎。《数据挖掘》课程作为大数据与 AI 人才培养体系中的关键课程,不仅面向计算机专业学生,还涵盖统计学、数学等多个学科内容,具有显著的多学科交叉特征。

当前数据挖掘课程采用的传统讲授式教学(Lecture-Based Learning, LBL)面临双重困境:一方面,由于课程内容涵盖面广、理论体系庞杂、算法推导复杂,导致教学效果欠佳,学生普遍存在畏难情绪;另一方面,有限的课时安排使得实践环节流于形式,仅停留在理论验证层面,缺乏真实场景的应用训练,最终导致学生难以将所学知识转化为解决实际问题的能力[2]。

针对传统数据挖掘教学模式中理论教学难度大、应用性薄弱等问题,本文提出基于产教融合的项目式学习(PBL)教学改革。PBL 作为一种以学生为中心的教学方法,引导学生围绕项目目标展开学习,通过主动收集信息、获取知识、探讨方案来解决现实问题,从而有效激发其学习积极性与参与度。因此,设计优质项目是PBL 实施的关键。本研究采用产教融合模式[3],引入企业真实案例,指导学生实施与课程内容紧密关联的数据挖掘项目;随后教师评估项目成果并针对性补充理论,确保知识体系完整覆盖。通过这种项目驱动与理论补充相结合的方式,产教融合PBL 教学有效提升了学生的主动性与学习成效,实现了从“以教导学”向“以学定教”的转变。

2 产教融合教学的实践模式与项目筹备

数据挖掘是计算机科学与技术专业领域的一门核心主干课程,涉及到多个专业领域的知识,课程内容覆盖面广、交叉性强,十分契合产学合作共建课程的改革方向。本课程主要包括数据探索、数据预处理、分类、回归、聚类、Web 挖掘等技术的理论学习,以及这些技术基于 Python 语言环境和 sklearn 数据挖掘 API 工具库的应用实践。此外,本课程强调学生的动手能力,结合企业背景,从企业处理的实际数据问题出发,理解数据特征的概念,掌握分类、回归、聚类等技术的数据建模和挖掘分析,要求学生通过编程练习和典型应用实例加深理解。

本次数据挖掘教学改革先后与科大讯飞、东软教育等企业进行产教融合教学设计与实践,企业针对互联网大数据行业就业岗位需求进行实际指导。合作企业专注核心技术,落地全行业,赋能全行业,不断完善互联网大数据产业链,经过多年的积累,已有很多成熟的经过项目实践的大数据应用经验,通过校企合作将最新的技术和业务模式带进学校,增补数据挖掘课程资源及案例,案例名称及其基本要求包括:(1)基于互联网在线用户行为数据预处理技术案例,使用numpy 完成数据特征预处理;(2)基于逻辑回归技术预测心脏病二次发作率案例,使用sklearn 实现逻辑回归预测;(3)基于线性回归技术预测某社区新客户的热燃油用量案例,使用 sklearn 实现线性回归预测;(4)基于分类技术对某零售商产品精准广告投案例,使用sklearn 实现决策树和神经网络分类预测;(5)基于聚类分析方法的患冠心病率状况探索案例,使用sklearn 实现K-Means 聚类分析;(6)基于文本挖掘技术对垃圾短信邮件精准检测案例,使用sklearn 实现TF-IDF 特征提取;(7)基于协同过滤算法的电影推荐系统案例,使用python 语言完成电影推荐系统的实现。

3 产教融合教学的实施方案

本课程注重理论教学与实验的结合,注重学生实践能力的培养。课程总共 48 学时,其中实验16 学时由合作企业主导完成,具体包括数据的预处理、分类预测、聚类分析、Web 挖掘等内容。通过对问题的分析,建立数据挖掘模型,提取数据特征,并进行相应的分类、聚类和Web 挖掘分析,完成数据挖掘算法的设计与应用。具体的实验课时教学进度安排如下:

1.数据预处理实验,4 学时:企业案例——基于互联网在线用户行为数据预处理技术,实验内容包括:<1>数据加载;<2>numpy 特征预处理; <3> 数据导出。

2.分类与回归实验,6 学时:企业案例——(1)基于逻辑回归技术预测心脏病二次发作率;(2)基于线性回归技术预测某社区新客户的热燃油用量;(3)基于分类技术对某零售商产品精准广告投。实验内容包括:<1>数据加载并可视化; <2> 特征预处理; <3> 训练逻辑回归模型/多元线性回归模型/决策树模型/神经网络模型;<4>交叉验证调优; <5> 模型预测并应用; <6> 数据导出。

3.聚类分析实验,2 学时:企业案例——基于聚类分析方法的患冠心病率状况探索,实验内容包括:<1>数据加载;<2>特征预处理; <3>I K-Means 模型预测;<4>模型评估; <5> 模型可视化。

4.Web 挖掘实验,4 学时:企业案例——(1)基于文本挖掘技术对垃圾短信邮件精准检测;(2) 基于协同过滤算法的电影推荐。实验内容包括:<1>数据加载; <2> 基于 TF-IDF 算法抽取数据样本的特征向量; <3> 模型训练;<4>模型预测; <5> 模型评估。

4 总结

基于产教融合的数据挖掘课程PBL 教学改革的基本宗旨是校企双方集合各自优势,共同建设数据挖掘精品课程。结合真实的各行业的成功实施案例让学生完成PBL 学习,了解互联网大数据行业动态、技术应用、落地场景,为校企深入融合提供有力基础保障,为在校学生未来的就业提供帮助。在人才培养建设上,与行业和企业紧密合作,深化产教融合,以互联网大数据行业人才标准需求规格和岗位技能要求分析为逻辑基础起点,以需方对人以行业和企业需求为基准才的审视要求,构建新型人才培养方案。通过企业实践实操和专业课程的植入,让使企业深度融入参与学校的人才培养过程,真正实现专业建设与产业发展同步、人才培养与社会经济发展接轨。

参考文献

[1]殷丽凤,刘震.基于产教融合的机器学习课程实践能力提升教学改革[J].计算机教 育,2025,(04):156-161+170.DOI:10.16512/j.cnki.jsjjy.2025.04.050.

[2]尹海涛,徐丰羽,王强.模式识别课程的产教融合教学设计与实践[J].集成电路应 用,2023,40(10):80-82.DOI:10.19339/j.issn.1674-2583.2023.10.031.

[3]罗秀丽,陈平.产教融合背景下“神经网络与深度学习”课程教学改革[J].工业和信息化教育,2022,(11):17-21.

基金项目:武汉市教育局市属高校教研课题(2021016);武汉市科技局知识创新专项项目曙光计划项目(2022010801020382)。

作者简介:*通讯作者:刘哲(1989—),男,人,博士,讲师,研究方向包括图像处理、计算机视觉、机器学习等,E-mail:zheliu@jhun.edu.cn