生成式人工智能在自然语言处理领域的实践与应用
刘跟奎
兰州现代职业学院 甘肃兰州 730300
引言
随着人工智能技术日新月异的发展,在自然语言处理领域的生成式人工智能开始展现出极大的潜力和应用前景。所谓生成式人工智能,主要是指人工智能系统能够生成内容,不同于以往的人工智能判别式模型,生成式人工智能不仅能够理解数据、处理数据,还能够创造全新的数据且保证数据合理性。在自然语言处理任务中,生成式人工智能系统已经开始在改变我们的人机交互方式以及计算机在处理和理解人类语言方面的能力。[1]
本文首先分析了生成式人工智能技术和自然语言处理技术的基础概念和发展背景,并分析了技术构成即自然语言语言模型、序列生成技术以及注意力技术等。[2] 随后分析了其具体应用体现在文本生成技术、对话技术、翻译技术等具体 NLP 技术上的应用,结合具体案例分析了应用技术效果,并分析目前技术发展瓶颈以及未来可能的技术发展方向等。
一、生成式人工智能与自然语言处理概述
生成式人工智能是一种内容创造型的人工智能,其主要的特点在于它区别于简单的判别式模型,它不仅在已知的数据上进行判断,还能够预测分析学习的数据,并在未来的时间尺度中产生新的具有统计相似性的、全新的分布和模式。这在自然语言处理任务中表现得尤为突出,生成式人工智能可以创造出逻辑连贯、语义可理解性的句子。
自然语言处理是人工智能的一个重要领域。自然语言处理研究的是人与计算机之间的自然语言交流过程。自然语言处理领域的研究任务从自然语言理解到高级语言生成,从基于规则和统计模型的传统自然语言处理任务到基于深度学习的自然语言处理任务,自然语言处理中语言的不确定性、语境、表示丰富性等特点,使得人与计算机之间的语言交流变得十分复杂。
生成式人工智能与自然语言处理结合可追溯到早期的自然语言模型和统计机器翻译,而真正的发展则是起源于循环神经网络、Transformer 结构的提出,2014 年序列到序列学习结构出现为生成式 NLP 奠定了基础,在此基础上,注意机制被提出,这解决了长序列的处理问题。2018 年具有里程碑式贡献的预训练语言模型出现,它们从海量的语料中预训练获得了足够的语言表征和生成能力,这标志着生成式NLP 迎来了新时代。[3]
随着模型的发展,训练方法的提升,近年来基于生成式的自然语言处理已经取得了飞跃式的发展。自然语言技术从实现简单文本的自然语言处理向高质量长文本处理、机器人对话系统等更高质量的文本处理发展,机器译文从机械式的译文向接近人类水平译文转变。这些技术的不断提升推动了自然语言的发展。
二、生成式人工智能的核心技术
在自然语言处理领域,语言模型是生成式人工智能最基础的技术模型,传统的 n-gram的语言模型预测方式就是通过统计学习的方法学习语言序列的联合概率。深度学习的神经网络语言模型可以克服长距离依赖问题,而采用 Transformer 的架构的语言模型,比如 GPT 系列模型的训练方式,采用自注意力机制来对全部的输入序列进行全局建模,极大地扩展了语言建模的能力。[4] 以自回归的方式生成文本,即对于输入的序列,逐一预测生成,直至生成一个语言的序列。
序列生成的方法是指生成式人工智能进行文本生成最根本的技术,最简单生成序列的方法是指贪婪搜索(Greed Searching),在每一个时间步输出可能性最大的词,是最快速最省力的一种,但很容易产生重复单调的生成内容,具有计算上的优势。束搜索(BeamsSearching)方法保留多个候选序列,部分解决了贪婪搜索重复序列的问题,但输出的序列仍然不具备创新性。近几年比较热门的采样方法有:温度采样(Temperature Sampling),top-k 采样,top-p 采样(核采样),增加了采样的随机性,使输出内容具有多样性、更符合自然语言,其中,top-p 采样动态决定候选词集合规模的大小,在保证生成内容丰富的前提下提供输出内容的多样性,使输出更自然。
注意力机制是解决长序列依赖的重要方法,传统循环神经网络在处理长序列时会出现梯度消失或梯度爆炸问题,注意力机制可以计算输入序列的一部分与当前序列位置的权重,实现对任意位置的直接访问。Transformer 将注意力机制发展成自注意力 (Self-attention)机制,使得模型能够在没有循环连接的情况下处理序列数据,并且该思想被多头注意力进一步发展,能够让模型同时关注到不同表示子空间中的信息。不仅这些技术创新能够增加模型的表达能力,而且并行计算成为可能,生成速度得到极大的提升。
预训练与微调范式的引入成就了现代生成式人工智能。预训练语言模型需要在大量有标注和无标注的语料上进行自动的监督学习,掌握通用性的语言理解和生成能力,并在下游任务上微调,从而快速适应下游任务。迁移学习范式大幅度降低了数据依赖,使生成式人工智能可以在少量特定任务数据上,就能达到很好的能力表现。提示学习 (Prompt Learning)、指令微调 (InstructionalFine-tuning) 等技术的引入,让这些预训练模型能够以自然语言指令的方式,更精准地生成目标内容。
三、生成式人工智能在NLP 任务中的应用
文本生成是生成式人工智能最直接的应用。给定一个指令或主题,生成式人工智能被赋予了现代生成式模型,可以根据所给的指令生成流畅的文本信息。例如,新闻报道,小说写作、诗歌写作等。具体到应用场景中,它们通常作为写作助手,帮助写作者打开思路,提升写作效率。例如:一些新闻机构已经开始将人工智能系统应用于财经新闻、赛事综述等结构化文本的自动生成,较为高级的系统甚至可以根据对风格的要求改变生成文本的话语风格、词汇搭配,以适应场景的需求。值得注意的是,虽然生成质量不断提升,但生成式人工智能要完全取代作者,比如,在写作任务中需要深度思考、发挥创造力的场景,生成式人工智能仍然难以企及人类作者的思辨深度、写作高度。
对话系统是生成式人工智能的另一个应用方向。与基于规则匹配或检索的对话机器人不同,基于生成式人工智能的对话系统更自然、更灵活、对指令的反应更快。对话系统主要分为开放域和封闭域两种,其中开放域对话系统以闲聊为主,封闭域系统承担客服或技术支持等特定领域或特定任务。以 ChatGPT、DeepSeek 等为代表的新一代对话系统具备强大的对话和复杂语境认知能力,能够理解复杂的问题、记忆语境中的上下文、生成语境和指令相匹配的回答。现有系统在对话逻辑连贯性、生成不匹配和不恰当内容、识别与理解错误意图等方面还存在技术局限,是今后生成式人工智能技术发展的重要领域。
机器翻译作为自然语言处理领域最基本的翻译任务之一,被生成式人工智能灌注了灵魂,实现了质的飞跃。不同于以往的基于短语的统计机器翻译,基于编码器 - 解码器的神经机器翻译系统可以学习语言到语言的端到端映射,同时还可以基于大量的多语言预训练进一步提升低资源语言的翻译性能,一些先进的系统甚至可以实现零样本翻译,也就是不需要训练数据便可进行翻译。不同的翻译模式被赋予不同的生成式人工智能,风格适应、口语化等翻译便成为可能,不同用户的差异化需求被它满足。[5]
除了以上的主要应用,生成式人工智能还在众多其他 NLP 应用中不断扩宽应用范围。文本摘要方面,将长文本通过生成式模型提取信息生成文本概括,包括抽取式和生成式两种方式。问答系统中可被生成式人工智能搜寻到已有答案,人工智能根据多源信息组合生成新的解释。代码生成是增长较快的应用领域之一,人工智能助手能够通过自然语言描述生成代码,极大提升了软件开发效率。生成式人工智能在商务场景中也被不断应用,包括内容创作协助、电子邮件协助撰写、广告文案生成等,为企业自动化生产提供了高效的人工智能智能解决方案。
四、生成式人工智能在实际应用中的效果
在媒体行业,生成式人工智能已经衍生出若干应用场景,其中之一便是新闻报道数据的生成。多家大型新闻机构已经在财经新闻、体育新闻、气象新闻等领域引入了人工智能应用。[6] 国外某通讯社使用生成式人工智能系统来处理企业报表的数据,生成相关财务数据,只需几分钟时间即可完成重要指标数据提取、趋势预测和新闻文本生成,并通过识别结构化数据的关联,结合预设的新闻语言、写作格式等生成新闻。实践证明,由人工智能生成的新闻数据更加客观、实时,在处理同等主题的报道新闻上要比人工数据更为快速,但部分深度解读、复杂事件的报道还需人工新闻编辑再进一步加工完善。
生成式人工智能是目前客户服务领域中使用最广泛的智能客服应用。某电商平台基于生成式人工智能提供的客服机器人,目前能够自动应答 75% 的咨询问题,机器人能够结合产品数据库、知识库和以往沟通记录,准确识别客户自然语言生成答案。[7] 相比于传统的菜单式客户服务系统,生成式人工智能智能客服自然亲切,客户体验感好,客户满意度高,在客户集中咨询时段,机器人客服同时应答数以千计的咨询问题,缓解人工客服压力。但对于复杂的投诉问题或需要人工介入的特殊情况,智能客服仍存在局限,需要预设人工转接模式。
生成式人工智能在个性化学习辅导领域也有用武之地,在某线上学习平台的软件设计下,生成式人工智能学习辅导会根据学生的学习情况和知识掌握程度,分别生成不同的资料或者习题,在测试学生的知识盲点后,会根据学生生成不同的习题和答案,在提交答案的过程中如果有任何问题,生成式人工智能就会给出答案,并且讲述该题目的解题思路和步骤,然后根据学生的题目生成类似的习题进行练习。经过实验,使用生成式人工智能学习的学生,在同样题目的测试下,其平均测试分值提高了 10‰ 。这种学习辅导个性化非常适合不同需求的学生根据自己的学习情况来进行个性化学习,但是针对开放性问题的测试或创造性能力的测试评价还存在评价盲点,需要教师的人工评价才能达到教学目的。
五、挑战与未来发展方向
尽管生成式人工智能在人类自然语言处理方面已经取得了显著的进展,但其发展仍存在着一些实际性的问题,其中最大的问题就是有时其生成内容并不可靠,容易出现适得其反的情况。生成式人工智能在自然语言处理领域未来发展的几个方向值得思考:一是让人工智能模型更加高效,计算资源消耗更低,性能指标更高;二是生成内容可控,即人工机器人能精准生产出符合人们具体需求的输出;三是让多模态产出更加丰富,能够将文字、图片、声音等多种形式的信息有机地结合到一起,给人们带来更加丰富的交互体验;四是让智能机器人能更加精通于更垂直的行业领域,例如医疗行业、法律行业,能够产出更专业的人工智能内容。五是人工智能如何跟人类的创造力相结合,实现人机协作的内容创作。
六、结论
生成式人工智能技术完成了自然语言处理场景下的革新性应用,从简单语言生成到复杂对话应用的全范围普及、从自然语言翻译到教育领域的个性化学习,生成式人工智能技术已经全方位覆盖了人的信息交流与加工方式。随着语言模型范式革新、注意力机制提升、预训练及微调的成熟,在输出内容自然、可靠、实用方面,生成式人工智能系统的输出能力不断升级,大量应用实践已经验证了其不但为人类省时省力节支,同时通过智能内容输出拓展了应用范围、提升了体验感。但是同时还有许多技术问题:内容的真实性、偏见的可能、高计算成本、合道德、合规范等等。这些问题,关乎未来的技术发展和持续性应用。在未来的技术发展中考虑技术升级和风险控制问题,在改进提高人工智能技术的同时能够可控、可理解、可持续。需要计算机工程师、语言学家、道德哲学家、法律专家等多学科的联合攻关,共同创新,持续发展。
参考文献
[1] 欧盟联合研究中心. 生成式人工智能展望报告[R]. 布鲁塞尔: 欧盟委员会,2025.
[2] 林浩伟 , 王翔宇 , 严瑞琳等 . 大型语言模型复杂推理能力的生成式评估 [J]. 计算机学报 , 2025,48(03):1-15.
[3] 王飞跃 . 生成式人工智能的发展现状与趋势 [J]. 通信世界 ,2025,31(05):45-50.
[4] 中国科学院自动化所 . 紫东太初三模态预训练模型技术白皮书 [R]. 北京 : 中国科学院 , 2025.
[5] 适道 AI 组 .2025 年,AI Agent 剑指何方? [J]. 科技与创新 ,2024,12(11):33-39.
[6] 华为诺亚方舟实验室 . 盘古大模型:气象预测与科学计算中的生成式 AI[J]. 计算机研究与发展 ,2025,62(04):102-115.
[7] IBM 研究院 . 生成式 AI 将催生逾十亿新应用:Agentic AI 如何推动这一目标 [J].人工智能前沿 ,2025,6(02):78-85.
基金项目:甘肃省职业教育教学改革研究项目“基于‘生成式人工智能’的教学改革研究——以中高职《信息技术》为例”(ZZ-PX-20242028)。