音乐人工智能现状的调查研究

摘要：人工智能的兴起给音乐创作、表演带来一系列新的技术变革和发展契机，同时也带来了一系列的观念冲击。能否最终取代音乐家这一命题，在学界持续发酵着不同观点。本文基于当前人工智能技术在音乐实践中的应用现状展开研究，通过对音乐人工智能技术路径的剖析，从美学哲学维度探讨了其面临的诸多挑战性问题。涉及音乐情感传达机制、创作主体意识表征、创造性本质特征等深层理论问题，均被纳入研究视野。

关键词：音乐情感; 算法作曲; 音乐表演; 具身认知; 音乐创造

1956年于美国达特茅斯学院召开的"人工智能夏季研讨会"上首次提出的"人工智能"（Artificial Intelligence，AI）概念，在当时并未形成明确定义。更受与会学者关注的，是如何通过机器设备实现人类智能的模拟这一具体议题。现在学界普遍认可的界定是科学家帕特里克·温斯顿（ Patrick Winston）的抽象定义： “人工智能是对计算的研究，以实现感知、推理和行动。”[1]

人工智能技术的潜力及在音乐领域一日千里的快速发展，让人们开始思考：音乐人工智能有真正的音乐智慧、音乐理解力、音乐创作力和音乐表演能力吗？它们是否会有美感经验、情感理解和审美表达？人的音乐实践有哪些是可以被人工智能取代，哪些不能被取代？这些问题的探讨显然已超出纯粹科学技术范畴，涉及哲学思辨与美学研究领域。对人类主体性核心构成挑战的人工智能技术，要求我们必须从哲学美学视角出发，对音乐创作与表演行为中涉及的意识活动、主体性体现、情感传达及审美认知等议题展开系统性考察。

一、当前音乐人工智能的主要技术路线和发展现状

音乐人工智能的发展建基在人工智能技术的整体发展之上。人工智能技术的发展，从20世纪 50 年代起，大致经历了三个阶段：第一个阶段为推理期（ Logic Reasoning，1956－1960），其实质是定理自动证明系统，功能以做数学运算和推理、证明数学公式为主，如西蒙和纽厄尔等人创建的“逻辑理论家”系统。到了20世纪80年代末，以数理逻辑为基础的人工智能走到了尽头。第二阶段为知识期，这一阶段的主要研究方向是把人类掌握的知识总结起来以编码的方式“教会”机器，即所谓的“专家系统”，如菲根鲍姆等人创建的DENDEAL系统。在这个阶段，研究人员最终发现，把知识总结出来，教给机器其实非常困难。这不仅是因为人类的知识不太容易被总结和编码，更因为人类有大量的“默会知识”无法被总结和编码。第三阶段为学习期（20世纪90年代至今），这一时期研究的出发点是让计算机系统“自我”学习。显然，由于音乐艺术的特殊性和复杂性，在前两个阶段，音乐人工智能是无法取得实质性突破的。

在第三个阶段学习期，机器学习或深度学习成为了人工智能发展的主流。所谓的“机器学习”，就是“通过算法，使得机器能从大量既有数据中学习规律，从而对新的样本做智能识别或对未来做出预测”[2]。“深度学习”是一种基于人工神经网络的机器学习技术，人工神经网络仿照生物神经系统工作原理的计算模型，通过多个人工神经元之间的连接和信息传递，模拟人类大脑的感知、思维和决策等过程。[3]深度学习属于机器学习的一个分支，二者的主要区别在于数据的分析方法。前者依赖算法和大量的数据，后者则是以人脑为模型的人工神经网络。按照机器学习技术路线之差异，可划分出五大主要学派性存在：符号主义派、联结主义派、贝叶斯学派、进化主义派以及行为类比学派。各学派采用相异之算法体系，致力于对人类思维模式、神经系统构造及行为特征进行仿真性复现。由此实现机器设备从数据中自主习得知识，并完成预测与决策之功能。音乐创作领域正经历着由机器学习技术引发的变革性进程，深度学习等新兴技术为音乐人工智能带来诸多创新性突破。这些突破性技术已被广泛应用于作曲实践、演奏活动及音乐学研究等多个层面。

现有的人工智能系统无论采取何种技术范式，其学习过程均可分解为三个基础性阶段：训练阶段、预测阶段与反馈阶段。在音乐创作领域亦存在类似的三个阶段：首先是对既有音乐作品进行系统性分析处理，将其转化为可供计算的"模式-组件"结构；其次是对分解后的音乐元素实施相似度计算与归类处理；最终通过预设算法将各类音乐元素重新组合排列以生成全新作品。

二、艺术经验与音乐的创造性问题

2021年，在音乐人工智能领域引起广泛关注的，是由德国卡拉扬研究所罗德牵头组建的规模达百余人的AI音乐团队所实施的项目。基于贝多芬遗留的音乐手稿及其他相关史料，该团队成功实现了人工智能版本《贝多芬第十交响曲》的完整创作与公演。

参与该项目的研究人员包括：来自美国罗格斯大学的艾尔格莫，其核心工作在于运用贝多芬作品训练神经网络模型并生成所需音乐片段；奥地利籍作曲家沃尔佐瓦则承担着从AI产出素材中筛选最优片段进行最终合成的任务；康奈尔大学计算音乐学专家高特姆，专注于贝多芬手稿的数字化识别及AI生成乐谱的编辑整合工作。实例可见，古谱研究权威兼钢琴演奏家莱文负责对原始手稿进行校勘，通过钢琴视奏方式验证AI生成乐谱，并由精通贝多芬风格的专家组最终判定其风格吻合度。

经由手稿分析过程、数据训练阶段、神经网络架构搭建、算法参数调试环节、MIDI乐谱生成系统、演奏试听评估以及乐队总谱编制等系列复杂工序，最终实现了舞台呈现。不得不指出的是，具有显著"贝多芬式特征性"的该作品，体现为延伸性尾声段落、力度对比明显、和声推进模式独特、动机展开手法典型和终止式处理方式特殊等要素。对于贝多芬作品体系熟悉的聆听者而言，能够轻易辨识出该创作与作曲家本人作品间存在着显著的"风格相似性"。评论家Henk Douwes的观点或许反映了普遍存在的困惑：该作品在听觉层面确实呈现"贝多芬化倾向"，但从音乐本体角度审视，更像是对作曲家前期作品的简单模仿体，《第五交响曲》谐谑乐章元素被过度使用导致听觉不适感。即便现存的创作手稿确实包含贝多芬早期音乐素材的痕迹性元素，并不意味着最终成品必须发展至现有形态。以贝多芬的天才创造力而言，会接受如此缺乏原创性的"复制品"吗？

现有研究还没有解开人类创造行为的密码。但是人们已经意识到，人类的“创造性”是一个复杂综合的身心过程，它无法单独通过心理学、神经学、生理学来解释，更难以通过函数和程序来表示。从根本性质而言，人工智能以数理逻辑为基础，但创造性的独特属性却不易被逻辑或数学所涵盖。当前，在音乐领域中，所谓“创作”由人工智能展现，难称真正意义上的“创造”，不过是某特定程序基于输入数据进行的一种“组合”而已。

穿越漫长岁月俯瞰，人造智能属人类众多创新工具之一，正如历代工具一般，其亦超越人能力量诸多方面。此等工具作用于延伸彼某就业功能，并部分替代。但与过往各式工具相比拟，人工智能则扩展了脑力，而其作为工具之本质仍未变。不失尊严并抱怀自信，我们人类大可坚信：只要永不停歇地“反思自身”、持续开拓审美体验、增进对同伴理解，同时不断探索并扩宽艺术表现形式，无论怎样的未来等待我们，必将持久涌现不朽曲调，滋养每个人类之精神疆域。

参考文献

[1]Patrick Henry Winston，Artificial Intelligence ，Boston： Addison-Wesley Publishing Company，1992，p. 5.

[2]余凯等：《深度学习的昨天、今天和明天》，《计算机研究与发展》，2013年，第9期，第1799—1804页。

[3]孙志军、薛磊等：《深度学习研究综述》，《计算机应用研究》，2012年，第29 （ 08）卷，第2806—2810页。

作者简介：文泽（1999—），男，汉族，四川成都市人，硕士研究生在读，单位：四川音乐学院，研究方向：钢琴表演。

音乐人工智能现状的调查研究

文泽

Related Articles

“文创+新媒体”赋能竹荪特色农产品的创新实践与发展路径探索

习近平地方工作期间老干部工作论述对高校离退休党建的启示

基于大数据分析的工科专业课程优化与评估研究

成品油销售企业如何做好党建引领下的“八气”塑造

公路水运试验检测技术在道路工程中的应用与发展研究