数字水印技术的应用
许鹏飞 王馨雨
国家计算机病毒应急处理中心 天津市 300392
引言
在数字媒体诞生初期,相关的法律还未完善甚至还未出现,再加上数字媒体很容易被盗取,版权、盗版等问题对早期的数字媒体市场造成了极大的冲击。为此,各国的学者开始寻找应对的方法,信息隐藏技术为数字媒体的产权验证、保护提供了可能性。
所谓信息隐藏,就是通过加密技术,将要传递的信息通过加密,然后放入到普通的媒体中,使得攻击者无法获取到重要信息,即使截获到发送的信息也无法解读。信息隐藏大体上可以分为两种:一种是加密,通过加密算法对要传递的信息进行加密,使得信息即使被截获也不能解读;另外一种就是隐写术 [1],将信息伪装成别的样子,使信息无法被截取。上世纪计算机的发明和互联网的普及之后,隐写术开始拓展到了计算机领域,也就是数字水印。
一、数字水印技术
1.1 数字水印的概念
数字水印技术,即使用特定的算法,将水印信号写进数字内容(如图像、音频、视频、文本等)中,嵌入之后要求不能明显的影响原数字内容的视听觉效果,且嵌入的水印不易被发现、篡改,即使水印被以特殊的方法提取出来,也不能理解水印所含有的特定信息。
1.2 数字水印的特点
一般来说,一个合格的数字水印应具备以下特点:
1、鲁棒性。对于嵌入到数字产品中的水印信息,需要能够经受住常见的攻击(例如内容篡改、有损压缩、加噪声等)之后,仍能够使用提取算法将水印信息提取出来。
2、不可感知性。嵌入水印信息后的数字产品不能在人的视听觉感受上与原始内容有明显差别。
3、安全性。由于网络发展,各种攻击技术广泛传播成熟,水印必须通过一系列的加密手段处理后再进行嵌入,这样即使水印被黑客以非法手段提取出来,也无法知晓水印中包含的信息。
4、嵌入容量。在原始内容中每个单位内嵌入的水印信号的数据量被称作水印的嵌入容量。容量需要在不破坏水印的不可感知性和承载足够的信息直接进行平衡。
1.3 数字水印的分类
根据水印嵌入的数字内容载体类型,数字水印大致分为以下几类:
1、图像水印,是将水印信息嵌入到图像文件中,用于保护图像的版权、防止图像被篡改等。例如,摄影师可以在自己的作品中嵌入包含个人信息或版权声明的水印。
2、视频水印,是针对数字视频载体,利用视频的时间和空间冗余加入水印信息,既不影响视频质量,又能达到版权保护和内容完整性检验的目的。比如在电影、电视剧等视频内容中嵌入制作方或版权方的标识。
3、音频水印,通过利用音频文件的冗余信息和人耳的听觉特性,将水印嵌入音频内容,以保护数字音频产品的版权。如在音乐作品中嵌入唱片公司的标识或版权信息。
4、文本水印,是将水印信息嵌入到文本数据中,如电子文档、电子书等。通常通过改变文本的格式、字符特征或利用文本的语义信息来嵌入水印,用于验证文档的版权或防止文档被非法篡改。
1.4 数字水印的应用
数字水印的目前主要的应用有以下几种:
1、数字产品的产权保护
数字产品的产权保护是数字水印的主要应用领域。由于数字产品的盗取非常容易,因此在数字产品中嵌入含有版权信息的水印,以此来达到维权的目的,在遇到版权纷争时,数字水印可以鉴别数字产品的真伪,只需要通过水印提取算法,来检查数字产品中是否含有水印信息。
2、隐蔽信息
有的时候,攻击者想要的并不是数字产品本身,而是产品的标识信息,因为标识信息可以验证真伪,他们在盗取时需要获取标识信息。可以通过将标识作为水印嵌入到数字产品文件中,使其无法被直接获取,只能通过特定的算法提取出来。
3、身份认证与抗抵赖
在数字产品中嵌入与使用者相关的水印(如电子签名),可确认内容接收者或传播者身份,避免抵赖行为,以此满足网络安全中不可否认性要求。
4、内容完整性校验
部分水印设计为 “脆弱性水印”,当内容被篡改时,水印会发生相应变化,通过检测水印状态可判断内容是否被恶意修改,保障信息完整性。
二、数字水印算法
2.1 数字水印算法
数字水印算法的过程大致分为以下几个部分:
1、水印信息的产生。水印是嵌入到数字产品中的信息,通常是一些产品版权信息、产品编号等能够证明产品真伪的信息等,或者直接使用密钥生成一串随机数来当作水印信息。
2、水印图像的预处理。出于安全性考虑,水印信息在嵌入数字产品之前,要先经过预处理,这样即使水印被以非法的手段提取出来,也不能获得水印图像含有的信息,常用的预处理方法比如 Arnold 置乱 [2]。
3、水印加密算法。将预处理后的水印信息嵌入数字产品的目标区域中,同时需要保证不可感知性、安全性、鲁棒性等。
4、水印提取算法。从经过处理的数字产品中提取或验证水印信息,以此实现版权追溯、完整性验证等目的。
2.2 几种数字水印算法介绍
数字水印算法目前已经非常多样,以下介绍几种经典的算法:
1、最低有效位 (Least significant bit,LSB) 是一种经典的数字水印加密算法。该算法将原始文件转化为二进制数据处理,找到每个采样点的二进制数的最低位,并将其换为水印信息,以此来达到嵌入水印信息的目的。这种算法是比较简单的一种,很容易就能实现,但是缺点是鲁棒性很差。
2、离散傅里叶变换 (Discrete Fourier transform,DFT) 是一种比较常用的分析方法,可以将时域的内容转换到频域进行分析,首先对原始内容进行分段采样,然后对每个采样点的数据分别做离散傅里叶变换,在变换后的数据中选取中频系数作为水印图像的嵌入点,嵌入水印信息后再进行逆离散傅里叶变换,得到嵌入水印后的数字产品。
3、离散余弦变换 (Discrete cosine transform,DCT) 可由离散傅里叶变换演化而来,是离散傅里叶变换的一种变形,但不同的是离散余弦变换不涉及虚部,且变换后信息大部分聚集在信号的低频部分,DCT算法步骤与DFT 算基本相同。
4、离散小波变换 (Discrete wavelet transform,DWT) 是目前比较主流的一种频域水印加密算法之一,能够同时分析时域和频域的局部特性。经过小波分解后的原始内容被分为了低频分量和高频分量,通常把水印信息嵌入到低频分量中,这样水印具有较好的鲁棒性和不可感知性。
2.3 针对数字水印的攻击
通过各种技术手段破坏水印的完整性、不可提取性,或降低水印的有效性(如使其无法被正确检测、提取)即视为对数字水印的攻击。一般来说,常见的攻击方式有以下几种:
1、常规攻击。这类攻击原本是对数字产品的常规处理(如压缩、裁剪),但可能间接破坏水印,既可能是用户无意操作,也可能被攻击者利用为攻击手段,常见的攻击方式有压缩、裁剪、加噪声、滤波等。
2、同步攻击。这类攻击主要针对数字产品中的水印信息,受到攻击之后水印信息仍然完整的存在于数字产品中,但是水印信息已经错位,无法使用水印提取算法完整的提取出正确的水印。
3、恶意伪造攻击。这类攻击不直接破坏原始水印,而是通过伪造信息混淆水印的有效性,达到逃避版权追溯的目的。
三、总结
数字水印是保护数字内容权益的关键技术,其发展可追溯至上世纪,后续经国际国内学术推动逐步成熟,它通过在数字内容中嵌入隐藏标识实现版权保护等目标,目前已在媒体、金融等领域的版权保护、完整性校验、内容溯源等场景中发挥重要作用。
参考文献
[1]D. Artz. Digital steganography: hiding data within data[J]. IEEE Internet Computing,2001,5(3).
[2] 赵培越 , 张珍珍 , 丁海洋 , 李子臣 . 基于 Arnold 置换的交换加密水印算法 [J]. 计算机系统应用 ,2021,30(11):266-272.DOI:10.15888/j.cnki.csa.008206.