缩略图
Mobile Science

基于人工智能的自然语言处理研究

作者

沈蕴梅

苏州健雄职业技术学院 江苏太仓 215411 32058519640627632X

中国分类号:TP311.52 ;C931.47 文献标志码:A

Abstract:Iris Natural language processing is an important direction of artificial intelligence, which mainly studies various theories and methods for effective communication between humans and computers using natural language. This article starts with natural language processing and discusses the research content of natural language processing. Next, taking product sales as an example, relevant information about the product to be purchased is captured, analyzed, and displayed in order to better analyze and compare the product, providing a basis for consumers to purchase the product.

ywords: artificial intelligence ;Natural language processing ;data acquisition

0 引言

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言 , 所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

1 自然语言处理的研究内容

1.1 语言处理基础技术

自然语言处理(NLP)的基础技术旨在使计算机理解、处理和生成人类语言,其核心包括词表示与语义计算、语言模型与概率建模、基础任务与技术、语言处理系统与翻译等。

1.2 语言处理应用技术

语言处理应用技术的研究内容包括用户情感倾向分析、评论观点抽取、文本纠错及对话情感识别等。

1.3 理解与交互技术

自然语言处理中的理解与交互技术是人机智能交互的核心,通过语义解析、上下文建模及多模态融合实现自然沟通。

1.4 文本审核技术

自然语言处理(NLP)中的文本审核技术通过语义分析、深度学习等技术自动识别违规内容,已广泛应用于金融、社交媒体、医疗等领域。

1.5 智能写作技术

基于大数据技术分析信息,用固定算法重新排列组合,采用特定格式进行写作。虽然智能写作具有很大的局限性,但在效率方面远超人类。

2 自然语言处理的案例分析

简易采集数据

利用八爪鱼采集器中的简易采集模式获取两款智能手环的用户评价信息,保存为 Excel 文件。

分析情感倾向

新建自然语言处理客户端,然后读取上一步骤中的 Excel 文件,调用情感倾向分析接口,最后解析结果并输出关键信息。读取Excel 文件关键代码如下:

from openpyxl import load_workbook wb=load_workbook(“小米 .xlsx”) ws=wb.active comment=ws.cell(column 1=4 ,row=2).value r= client.sentimentClassify(comment) p=r ['items'][0]['positive_prob'] n=r ['items'][0]['negative_prob'] c=r ['items'][0]['confidence'] print(“情感积极概率”,round(p*100,2),”%”) print(“情感消极概率”,round (n*100,2) ),”%”) print(“分类置信度”,round (ακ100,2) ,”%”)

抽取评论观点

借助于百度 AI 的自然语言处理模块,对两种用户评论数据进行观点抽取,再对抽取结果进行解析。关键代码如下;opt={}opt['type' ]=11 r=Λ client.commentTag(comment,opt)for i in r['items']:if i['sentiment' :print(“该用户观点积极”)elif i['sentiment' ]==1 :print(“该用户观点中性”)else:print(“该用户观点消极”)自定义采集数据八爪鱼采集器所提供的简易采集模式虽然简单易用,但不够灵活,而自定义采集模式可以在网页上自行采取用户感兴趣的内容,模拟人工操作流程来配置规则。

3 结束语

自然语言处理是由其背后大量的基础任务及机器学习模型来支持的。目前自然语言处理的方法主要是基于深度学习,提取海量数据的潜在特征,让计算机具备文字阅读能力,帮助用户处理海量数据,提升数据挖掘深度,降低人工成本。

本文从自然语言处理谈起,讲述了自然语言处理的研究内容。同时,以商品销售为例,对所要购买商品的相关信息进行抓取分析及展示,以便更好地对商品进行分析比对。

参考文献:

[1] 肖正兴、聂哲 . 人工智能应用基础 [M]. 北京 : 高等教育出版社,2021:173-202.

[2] 程希等 . 机器学习算法在地球物理测井中的适用性及应用 [J]. 西北地质 ,2023(7):90-93.

[3] 孙社兵 . 机器学习应用于在线科学探究中的综述研究 . 现代信息科技 ,2023(7):103-110

作者简介:

沈蕴梅(1979-),女,硕士,讲师,籍贯,主要研究方向:大数据、人工智能技术。