基于大项目式的《机器学习》课程教学改革
李鲁英 周利玲
武汉设计工程学院 湖北武汉 430205,长江职业学院 湖北武汉 430074
一、引言
近年来,项目案例驱动、产教融合、混合教学成为高等教育改革的重要方向。项目案例驱动通过引入企业真实案例(如个性化推荐系统),增强教学的现实意义与应用价值;产教融合通过校企合作设计项目,提升学生的职业竞争力;混合教学结合线上资源与线下实践,提高学习灵活性与效率;挑战性学习通过高阶问题设计,激发学生的分析能力与创新潜能。本文提出了一种基于 PBL 的机器学习课程教学改革方案,融合上述理念,通过设计跨学科综合项目,整合理论与实践,旨在提升学生的学习成效与创新能力。通过教学实验验证,本方案显著提升了学生的实践能力和学习兴趣,为应用型本科机器学习教育提供了理论依据与实践参考。
二、教学设计
本研究在某高校软件工程专业三年级学生的《机器学习》课程中实施基于大项目式学习(PBL)的教学改革,融合项目案例驱动、产教融合、线上线下混合教学及挑战性学习理念。学生以 3-5 人小组形式自主设计并完成了13 个跨学科综合项目,涵盖以下内容:
(1)手写数字识别:基于开源数据集,学生采用多种机器学习算法(如 K 近邻、支持向量机等),通过模型验证与优化,提升数字识别的准确率。
(2)婴儿健康预测:基于公开医疗数据集,学生运用多种分类算法(如逻辑回归、决策树、XGBoost 等),结合特征选择与数据预处理,优化婴儿健康状况预测的准确率。
(3)糖尿病发生预测:基于公开健康数据集,学生使用多种分类算法(如支持向量机、随机森林、神经网络等),通过特征工程与超参数调优,提高糖尿病风险预测的精确度。
(4)新闻分类:基于公开新闻文本数据集,学生采用多种自然语言处理算法(如朴素贝叶斯等),结合文本预处理与特征提取,优化新闻类别(如政治、经济、娱乐等)的分类准确率。
(5)垃圾邮件过滤:基于公开邮件数据集,学生应用多种文本分类算法(如朴素贝叶斯、支持向量机、Transformer 等),结合文本特征提取与数据清洗,优化垃圾邮件与正常邮件的分类准确率。
此外,其他小组自主设计了以下项目:电影推荐系统、动物识别、音乐推荐系统、人脸识别系统、2000-2024 年全球环境趋势分析、手写字母识别、学生成绩相关性分析、二手房价预测。这些项目充分体现了学生的创新能力。
教学过程分为两个阶段,一是线上线下混合式理论学习,二是线下实践教学是基于大项目式学习(PBL)。
线上线下混合式理论学习通过学习通平台发布教学视频、课件和练习题,覆盖监督学习(如 KNN、线性回归、支持向量机)、无监督学习(如 K-Means 聚类)和深度学习(如 CNN、GAN)。学生在线完成章节测试,巩固理论知识。参考韦南等(2022),融入科学家故事(如Yoshua Bengio 对深度学习的贡献),增强学生兴趣。
线下实践教学是基于大项目式学习(PBL)的核心环节,旨在通过机器学习全流程的实践操作,培养学生的技术应用能力和问题解决能力。教师在课堂上使用 Jupyter Notebook 作为主要工具,通过交互式演示引导学生完成数据采集、数据预处理、算法实现、模型训练与优化以及结果评估的全流程。以“泰坦尼克号生存预测”项目为例,教师设计了结构化的实践教学环节,具体如下:
数据采集:教师首先引导学生从 Kaggle 平台获取“泰坦尼克号生存预测”公开数据集,包含乘客的年龄、性别、票价、舱位等特征以及生存状态标签。教师通过 Jupyter Notebook 展示如何使用 Python库(如 pandas)加载数据集,并介绍数据来源的可靠性与局限性,强调数据采集对模型性能的影响。
数据预处理:针对数据集的特点,教师重点讲解数据质量管理的重要性,包括缺失值处理、异常值检测和数据标准化。此外,教师还展示了如何对类别特征(如性别、登船港口)进行独热编码(One-HotEncoding),以适配机器学习算法的输入要求。
算法实现:教师通过 Jupyter Notebook 演示多种分类算法的实现,包括逻辑回归、决策树和随机森林。以逻辑回归为例,教师详细讲解了算法的数学原理(如损失函数和梯度下降),并使用 scikit-learn 库实现模型训练。学生随后在教师指导下,分组实现不同算法,比较各算法在泰坦尼克号数据集上的表现,培养算法选择的分析能力。
模型训练与优化:教师指导学生划分训练集和测试集(通常按8:2 比例),并通过交叉验证(如 5 折交叉验证)评估模型稳定性。针对模型性能优化,教师引入网格搜索(Grid Search)用于超参数调优,例如调整随机森林的树数量和最大深度。
结果评估与可视化:教师强调评估指标的选择与应用,讲解准确率、精确率、召回率和 F1 分数的定义及适用场景。学生通过Jupyter Notebook 计算并比较不同模型在测试集上的性能指标,并使用Seaborn 生成混淆矩阵和特征重要性图,直观展示模型预测结果和关键特征(如性别、舱位)对生存预测的贡献。
通过上述实践教学环节,学生在“泰坦尼克号生存预测”项目中不仅掌握了机器学习全流程的技术实现,还深入理解了数据质量管理的重要性。教师通过 Jupyter Notebook 的交互式演示,结合真实案例的逐步讲解,激发了学生的学习兴趣,培养了其分析问题、优化模型和团队协作的能力。
三、学习效果
结果表明,PBL 结合项目案例驱动、产教融合、混合教学显著提升了学生的实践能力、学习兴趣和创新能力。大项目的跨学科性质和真实案例背景(如个性化推荐系统与企业需求结合)促使学生将理论应用于实际场景,增强了问题解决能力。线上线下混合教学提高了学习灵活性,学生可根据自身进度完成线上测试和线下实践。产教融合项目(如二手车价格预测)进一步提升了学生就业竞争力。
四、结论
本文提出并验证了一种基于 PBL 的《机器学习》课程教学改革方案,融合项目案例驱动、产教融合、线上线下混合教学和挑战性学习理念,通过综合项目设计提升学生实践能力、学习兴趣和创新能力。实验结果表明,该方案显著提高了学生的算法应用能力和团队协作能力,同时保持理论学习效果。未来研究可进一步优化项目选题机制,探索如何解决数据质量和学生协作问题,为应用型本科机器学习教育提供更广泛的实践参考。
参考文献
[1] 昝冬平 , 乔守明 . 大数据专业统计学课程项目式教学模式的OBE 实践与效果分析 [J]. 秦智 ,2025,(06):102-104.
[2] 蒋军 , 张陈 , 梁栋 , 等 . 新工科背景下应用型本科单片机课程的项目驱动式教学改革 [J]. 物联网技术 ,2025,15(11):159-162.
[3] 王坤, 江浩, 王勇. (2024). 基于“项目案例驱动”的机器学习课程教学探究 . 计算机知识与技术 , 20(34), 156–159.
[4] 殷丽凤 . (2025). 基于产教融合的机器学习课程实践能力提升 教学改革 . 计算机教育 ,(1), 45–50.
[5] 白露露 . (2024). 应用型本科机器学习课程教学改革探索与实践 . 高等工程教育研究 ,(5), 90–94.
课题:2023 年湖北省教育科学规划课题“基于产教融合的项目式软件工程类课程建设探索实践”(编号:2023GB167)
作者简介:李鲁英(1987 年—),男,汉,山东郓城,讲师,机器学习与人工智能
通讯作者:周利玲(1989 年 -),女,汉族长江职业学院讲师,硕士研究生。主要研究方向:机器学习、图像处理。