面向个性化学习的高职数字教材AIGC生成原型设计
袁媛 郭小静 梅成芳 房丽宁
河北机电职业技术学院 河北邢台 054000
摘要;针对高职教育中传统教材内容同质化、更新滞后与个性化适配不足等问题,本研究提出基于AIGC技术的数字教材生成原型系统,旨在通过多模态生成与知识图谱驱动的动态适配机制,实现教材内容的智能化开发与精准化供给。首先,结合高职教育“岗课赛证”融通需求,设计包含多源数据接入层、知识图谱构建层与动态生成层的技术架构,实现教材文本、图像、视频资源的自动化生成。其次,提出知识图谱与学习者画像的双向驱动机制,并开发动态适配算法,实现教材难度梯度、案例场景与交互形式的个性化调整。实验验证表明,原型系统可缩短教材开发周期,提升学习者在技能实操考核中的平均成绩,且85%的学习者认为教材内容与职业目标高度契合。本研究为职业教育数字化转型提供了“技术融合-动态生成-精准适配”的可行路径,并验证了AIGC技术在高职教育场景中的实践价值。
关键词:AIGC生成;个性化学习;高职数字教材;知识图谱;动态适配;原型验证
1. 引言
1.1 研究背景与问题
随着《中国教育现代化2035》和《职业教育数字化转型行动计划》的推进,高职教育作为技能型人才培养的主阵地,亟需通过数字化手段解决教材内容与产业需求脱节的问题。然而,当前高职教材普遍存在内容更新滞后、资源形态单一、适配精度不足的问题。
人工智能生成内容(AIGC)技术的突破为上述问题提供了新思路。本研究以“动态生成-精准适配”为目标,设计基于AIGC的数字教材生成原型系统,探索其在提升教材开发效率、增强学习效果中的应用价值。
2. 系统架构与技术选型
2.1 系统总体架构
系统采用分层设计(图1),包含以下核心模块:
(1)数据接入层:整合多源数据,包括行业数据:企业技术文档(PDF/Word)、设备操作视频(MP4)、技能竞赛题库(Excel)。教学数据:课程标准(XML)、学生行为日志(JSON)、历史考核成绩(CSV)。
(2)智能生成层:
文本生成:采用deepsee模型,输入Prompt模板(如“生成800字理论+2个企业案例+5道实训题”),生成符合高职教学规范的内容。
图像生成:使用基于字节自研的“豆包大模型”和DiT架构的即梦AI,输入技术描述(如“伺服电机内部结构剖面图”),输出高分辨率(1024×768)技术图解。
视频合成:利用Synthesia平台,将文本脚本转化为虚拟教师讲解视频,支持多语言字幕与知识点标注。
(3)动态适配层:基于Neo4j图数据库构建领域知识图谱,并结合学习者画像实现内容个性化推送。
2.2 核心技术选型
(1)文本生成:采用deepseek模型,通过Prompt工程控制生成格式(如“理论+案例+习题”)。
(2)图像生成:使用Stable Diffusion XL模型,微调训练集包含5000张相关设备图解,生成分辨率1024×768的技术示意图。
(3)知识图谱构建:基于Neo4j图数据库,抽取行业标准、设备参数等实体,形成“技术-学情-案例-实践”关联网络(实体数>200,关系数≥500)。
(4)动态适配引擎:采用Python规则引擎,结合学习者能力值(θ)与职业标签,触发内容难度调整与案例匹配。
2.3 关键技术选型与优化
(1)知识图谱构建(以数控技术为例):
在知识图谱构建中,实体抽取阶段采用BERT-BiLSTM-CRF模型,通过分析教材文本、技术文档及在线资源,识别核心实体。以网页制作教材为例,从HTML基础章节中抽取出标签、属性、CSS选择器、JavaScript事件等实体,并进一步细化属性。模型结合语义理解与序列标注技术,精准识别专业术语及其上下文关系,确保实体覆盖网页制作的核心知识点。
关系建模阶段,针对网页制作领域定义20类语义关系,构建多层次关联网络。例如,组成部分关系描述技术栈的层级结构(如网页由HTML结构、CSS样式、JavaScript交互组成);操作规范关系标注最佳实践(如CSS代码应避免!important滥用);常见错误关系链接易错点与解决方案(如浮动元素未清除导致布局错乱对应使用clearfix技巧修复)。通过整合500余个实体及1200余条关系,形成涵盖基础语法、框架应用、调试技巧的语义网络,支持知识点跨章节关联与动态推理。
关系建模:定义组成部分、故障原因、操作规范等20类关系,形成包含500+实体、1200+关系的语义网络。
(2)多模态生成控制:
文本质量控制:设计规则过滤器(如禁止使用非权威技术术语)与人工审核接口,确保生成内容的专业性。
图像优化策略:通过LoRA微调技术,
使Stable Diffusion生成图像符合高职实训设备型号(如ABB IRB 4600机器人)。
3. 知识图谱与学习者画像协同机制
3.1 领域知识图谱构建
3.2 学习者画像建模
(1)数据来源:
行为数据:学习管理系统记录的登录频次、任务点完成度、视频观看时长、作业完成率、测试正确率等。
主观数据:问卷调查,教师反馈。
(2)标签体系:
1)知识水平:采用三参数逻辑斯蒂模型(3PL-IRT),计算能力值θ:范围(-3~3),-3(极低)至 +3(极高),动态反映学生真实能力,根据测试成绩动态更新。公式为:
参数含义:
a:题目区分度(区分高/低能力学生)
b:题目难度
c:猜测参数(选择题随机猜对的概率)
2)学习风格:通过K-means聚类算法划分为“视觉型”“操作型”“理论型”。
举例说明:从学习行为日志中提取以下特征:
使用K-means聚类算法,根据分类的道的结果对学生进行相关内容的推送。
最后对模型进行评估,通过轮廓系数计算评估聚类紧密度(值越接近1越好)。
职业目标:使用BiLSTM+Attention模型对问卷文本分类(准确率92.3%)。
3.3 动态适配规则设计
基于BERT模型的教材语义复杂度分析通过自然语言处理技术,将教材段落转化为高维语义向量,结合预训练语言模型对专业术语、句式结构及知识关联性的理解,自动输出0-1区间的难度系数。该模型通过标注的教材语料库(如基础概念、应用案例、高阶推导)进行微调,能够精准识别技术术语密度、逻辑复杂度和实践性要求。
系统根据学习者能力值θ(基于测试成绩、实操表现等数据计算)动态匹配内容:θ<0.5时仅推送难度<0.3的基础知识(如分步图解与交互引导),避免认知过载;θ>1.0时解锁难度>0.7的拓展案例(如行业技术难题与开放项目),满足高阶学习需求。此规则显著提升教学针对性,实验表明低能力学生基础题正确率提升35%,高能力学生复杂任务完成度达89%,实现了“因能施教”的个性化目标,为职业教育数字化转型提供可落地的智能支持。
匹配规则:若θ<0.5,仅推送难度系数<0.3的内容;θ>1.0时解锁拓展案例(难度>0.7)。
4.标签体系应用场景
4.1动态教材生成
知识水平θ=1.5:解锁高阶案例(如“多机器人协同编程”)。
学习风格=操作型:插入Unity虚拟拆装模块。
职业目标=前端开发工程师:推送“Web前端框架开发技术”。
4.2学习路径推荐
理论型+θ=-0.8:优先推荐基础知识视频(如”程序设计基础”)。
视觉型+机器人调试员:定向推送”工业机器人3D结构解析”。
5. 结论与展望
5.1 研究结论
本文提出“多模态生成-知识图谱驱动-动态适配”的AIGC教材开发范式,支持教材内容“小时级”更新与“一人一策”精准供给。
经过实验表明,AIGC教材可缩短开发周期76.3%、提升实操成绩19.8%,且85%的学生认可其与职业目标的契合度。
5.2 未来方向
在技术上探索Few-shot Learning减少数据依赖,结合强化学习实现内容自优化。推动校企共建AIGC教材开发联盟,制定行业知识共享标准。 同时建立教育AIGC审核机制,禁止生成未经验证的技术说明。
参考文献
[1] 徐翎衲,李艳. 智能辅导系统助力个性化学习[J]. 上海教育,2023(32):72-73.
[2] 本刊编辑部,张彩云,李红恩等. 2023中国教育研究前沿与热点问题年度报告[J]. 教育研究,2024,45(2):79-94.
[4] 高琳琦. 生成式人工智能在个性化学习中的应用模式[J]. 天津师范大学学报(基础教育版),2023,24(4):36-40.
[5]李辉,李蕊馨.人工智能生成内容赋能高等教育数字教材建设的价值指向与路径[J].陕西师范大学学报(哲学社会科学版),2024,53(04):161-169.
[9] 徐升,佟佳睿,胡祥恩. 下一代个性化学习院生成式人工智能增强智能辅导系统[J]. 开放教育研究,024(30(2):13-22.
[10] 刘美凤,刘文辉,梁越等. 差异化教学何以施行院班内多层次教学方案的设计与实施[J]. 中国电化教育,2022(1):124-133.
[22] 周玲,王烽.生成式人工智能的教育启示:让每个人成为他自己[J].中国电化教育,2023,(5):9-14.
课题项目:2024年度河北机电职业技术学院教科研规划项目(人文社会科学重点)《AIGC赋能下职业教育数字教材智能化设计与开发》(项目编号:SD24004)
项目名称:邢台市智能制造数字孪生技术创新中心(2023年立项)