基于GAN的数据增强技术研究
吕建超
武汉理工大学 430070
摘要:生成对抗网络(GAN)在2014年被提出后,随后便引起了大量深度学习研究人员于从业者的关注。GAN以两个网络相互对抗的方式进行训练从而获得有价值的模型,相比于传统的无监督学习的思路,GAN更加清晰易懂,并避开了传统无监督学习中遇到的困难。GAN已经在多个领域得到应用,对于提升数据训练的准确性和效率很有帮助。
关键词:GAN;深度学习;数据训练;准确性
1 引言
随着数据驱动和人工智能技术的不断发展,数据量的增加和质量的提高对于模型的性能提升至关重要。在实际的生产和科研中,数据的处理是一个非常消耗时间和金钱的过程。因此,数据增强技术成为了一种可行的解决方案,特别是在处理图像、语音和自然语言处理任务时,来指代通过各种技术生成新数据或修改现有数据的过程[1]。数据增强技术要遵循特定的步骤,包括数据的插值、扩展、外推以及生成四个步骤。数据的生成则是通过生成对抗网络(GAN)或变分自编码器(VAE)等生成新的数据。生成对抗网络(GAN)是一种深度学习模型,自2014年被Goodfellow及其同事提出来之后,在人工领域引起了广泛的关注和应用。本文对GAN的训练步骤、数学原理以及演变和应用进行了介绍,旨在帮助读者了解GAN的应用意义。
2 GAN的基本概述
2.1GAN的核心思想
GAN分为生成器和判别器两个神经网络,生成器的主要工作是生成假的模拟数据,而判别器则是对生成器生成的数据进行判别,判断生成器生成的数据与真实数据的差距。生成器和判别器之间是相互竞争的关系,两种神经网络在训练的过程中相互竞争,提高彼此性能的优越性[2]。如图1所示的GAN模型的原理图,其运作原理主要分为两个部分。
第一部分是生成器的训练,步骤如下:首先是生成假数据,接着这些假数据会被送入判别器中,判别器对进入的数据进行评估。生成器的运作目标是使判别器形成误判,若判别器对生成器生成数据的判断是准确的,则生成器会面临损失,生成器的训练目标是让这种损伤达到最小[3]。第二部分是判别器的训练,步骤如下:首先接收来自训练集的真实数据以及生成器生成的假数据,并对这两类数据进行区分。接着对真实数据和生成的虚假数据进行标记,目标是准确区分这两类数据。判别器的损失函数同时也反映了它在这两类数据处理上的表现能力。
3.3 时间序列生成对抗网络
TimeGAN是生成对抗网络(GAN)的一种变体,是由Jinsung Yoon、Daniel Jarrett和Mihaela van der Schaar于2019年提出[7],其核心功能在于生成与给定时间序列数据具有相近统计属性的合成时间序列数据。其旨在使生成的数据能够准确反映出真实数据中的时间关联性、时间变化趋势以及时间分布特点。TimeGAN融合了无监督范式所具备的灵活性以及有监督训练所提供的控制力,从而能够产生更为逼真的时间序列数据。对于在设备故障诊断中或者工厂能源消耗管理中,基于时间的生成数据将有非常重要的贡献,提前预测方便管理者提前采取对策,在天气预测,金融行业的应用也非常重要。
3.4 深度卷积对抗网络
深度卷积神经网络是将卷积神经网络CNN和普通的生成对抗网络结合的网络DCGAN[8]。DCGAN中结合CNN的目的是利用CNN中对于图像的提取特征能力,在训练过程中,一方面训练生成器以创造出逼真的图像,另一方面则训练判别器,使其能够准确区分出哪些是真实的图像,哪些是生成器所生成的图像。这种框架在图像生成和图像编辑等多个领域都取得了显著的应用成效。
在DCGAN中,生成器和判别器都采用了卷积层来替代全连接层,这样可以发挥CNN架构的优势,提取图像的空间特征,使图像生成获取更加准备的信息。在生成器与判别器中普遍应用批归一化方法,能够加快训练速度,并且增强模型的稳定性能及提升生成图像的质量。使用Tanh激活函数以控制在生成器中输出层的输出范围,而使用了ReLU激活函数;在判别器上用ReLU作为激活函数。
4 结语
本文介绍了GAN在数据增强技术中的重要性和优势,先后对GAN的训练原理、
数学原理及其演变和应用进行了分析。通过分析可知,GAN生成器和判别器可以作
为一种强大的数据生成和判别模型,运用生成数据和判别数据的分布来模拟真实数
据的状态。将GAN用于数据增强,可以高效率生成大量的逼真新样本,有效扩散了
深度学习的训练集,提升模型性能。另外,GAN具有多样性,可以根据模型的需求
演变为不同的形态,以满足新的需求,提高数据训练的准确性和科学性。
参考文献
[1] 顾亚奇,王琳琳.有意义的控制:基于生成对抗网络的AI艺术及其交互方式[J].装饰, 2021(8):98-102.
[2] 王宏妫,史先鹏.水下图像基于GAN去模糊的增强技术[J].海洋科学进展, 2022(002):040.
[3] 张钊光,蒋庆磊,詹瑜滨,等.基于VAE-GAN数据增强算法的小样本滚动轴承故障分类方法[J].原子能科学技术, 2023, 57(ZK):228-237.
[4] 孙成立,王海武.生成式对抗网络在语音增强方面的研究[J].计算机技术与发展, 2019, 29(2):6.
[5] 刘皓轩,林珊玲,林志贤,等.基于GAN的轻量级水下图像增强网络[J].液晶与显示, 2023, 38(3):9.
[6]朱晓慧,钱丽萍,傅伟.基于GAN的网络安全数据增强研究综述与展望[J].计算机应用与软件, 2022, 39(11):288-296.
[7]J. Yoon, D. Jarrett and M. van der Schaar, "Time-series Generative Adversarial Networks", Advances in Neural Information Processing Systems Curran Associates Inc., 2019.
[8] Radford, Alec, L. Metz, and S. Chintala. "Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks." Computer ence (2015).