国漫电影受众接受度的动态演化与影响机制研究
邓正敏 刘佳佳 邓陈纳言 孙楚越 颜伟杰 指导老师:刘凯
上海立信会计金融学院 上海浦东新区 201209
一、绪论
1.1 研究背景
新年伊始,动画电影《哪吒之魔童闹海》的火爆上映,标志着国产动画电影迈入了一个全新的时代。[1]《哪吒之魔童闹海》作为一部现象级动画电影,颠覆性改编传统神话,讲述魔丸转世的哪吒打破偏见、对抗天命的故事。以"我命由我不由天"为核心,创新塑造反英雄形象,融合水墨美学与现代 3D 技术,成为国漫崛起的现象级作品,其卓越的视听品质、富有感染力的剧情架构以及深厚的文化底蕴,既展现了当代中国动画的工业水准,更为传承千年的文化IP 赋予了符合时代精神的诠释维度。
1.2 研究意义和目的
当今,全球化使各国除了在经济、政治方面交流密切,在文化方面也联结频繁。]因此本项目通过构建基于随机模拟的受众接受度预测模型,量化分析影响影片传播效果的关键因素;同时运用LDA 主题模型对海量影评数据进行文本挖掘,系统揭示受众对影片核心主题的认知差异;在此基础上构建跨文化传播动态机制模型,深入探索传统文化IP 在现代传播环境中的转化规律。
1.3 研究方法与技术路线
本研究采用"数据驱动-文化解构"的双层分析框架,通过动态 LDA 主题模型与随机森林算法的有机融合,构建了一套系统的国漫电影受众接受度研究方法体系。技术路线上,首先通过多源数据采集(包括豆瓣影评、社交媒体评论及问卷调查)构建结构化数据库,并运用随机模拟技术生成符合真实分布的多维受众数据以弥补样本偏差。在分析阶段,采用随机森林模型量化年龄、地域等显性特征对接受度的影响权重,识别核心驱动因素;同时引入动态 LDA 主题模型,通过时间切片机制和动态 Dirichlet过程,追踪"视觉特效""文化认同"等潜在主题的强度演变及关键词语义漂移,揭示受众认知的时序演化规律。进一步通过Moran's I 空间自相关分析检验主题分布的地域聚集性,结合跨文化对比解析不同群体接受度差异的内在动因。
[1]丁文汐,张曼.《哪吒之魔童闹海》——国漫崛起新篇章[J].大众电视,2025,(07):7
[2]宋炙蓉.国漫跨文化传播的困境——以《哪吒之魔童降世》为例[J].声屏世界,2021,(17):74-75.
二、文献综述与理论基础
2.1 国漫电影受众研究现状
近年来,国内动漫产业快速增长,“ 95 后” “ 00 后” 成为主力观众群体。总体而言,国漫受众呈年轻化、高消费、兴趣多元的特点,这为产业发展提供了用户基础。
受众特征方面,研究表明中国二次元群体消费力强、消费习惯成熟。因此,国产动画电影的宣传和产品设计往往面向这一核心群体,但也需兼顾全年龄市场的扩展潜力。然而,目前学术界对国漫电影受众的系统研究仍较匮乏。尽管国漫电影观众基础广泛且潜力巨大,但专门针对观众特征和接受度的研究仍需加强,为国漫创作与营销提供更精细化指导。
2.2 前人研究综述
跨文化传播方面的研究则强调文化差异对国漫电影接受度的影响。有研究认为,过于特殊和厚重的民族文化容易引发所谓的“ 文化折扣” ,使得海外受众难以理解和接受。在实际案例中,中国动画电影《哪吒之魔童降世》等在国内大获成功,但在西方市场推广时也遭遇了文化隔阂导致的共鸣不足。这些前人研究提示,在国漫影片出口推广时,需要构建兼顾中华文化内核和国际受众认知的叙事体系,同时采用多语言版本、国际合作和适应性传播模式,以提高跨文化接受度。
受众特征建模与仿真模拟方法在相关研究中尚属前沿。近年来,Agent-BasedSimulation(个体构型仿真)可以用于模拟拥有不同特征的观众群体在信息传播过程中的行为;蒙特卡洛模拟(Monte Carlo simulation)则可通过大量随机实验近似预测结果分布,为不确定性分析提供多种情景输出。上述方法尚未大规模应用于国漫电影受众研究,但具备模拟观众偏好分布、评价指标浮动等方面的潜力,为后续受众行为建模提供了新的思路。
2.3 受众接受度评价指标体系
构建科学的受众接受度评价指标体系是定量研究国漫电影传播效果的基础。现有研究多从定量数据和定性反馈两方面着手:在定量层面,院线票房、各类评分(如豆瓣评分)、在线流媒体播放量等均可作为观众接受的间接体现。从网络反馈看,网络平台的点赞数、评论数、转发量等指标反映了受众对影片的即时反应。陈旭光等(2023)提出,“ 受众网络反馈指数” 将观看后产生的点赞、评论、提及等互动行为总和作为评价指标,通过对这些指标的分析可以直接了解海外受众的兴趣和选择倾向。
参考文献:
[1]陈玉婷. 国内动漫产业研究的进展和趋势[J]. 新闻传播科学, 2024, 12(4): 1091–1102[4].
[2]前瞻产业研究院. 预见 2022:《2022 年中国动漫产业全景图谱》[J/OL]. 腾讯新闻, 2022-06-07[1].
[3]艾瑞咨询. 中国社交媒体 ACGN 内容发展研究报告[Z]. 北京: 艾瑞咨询,2022[2][3].
[4] 唐诗. 基于文本挖掘的豆瓣电影评论的 LDA 主题模型分析[J]. 新闻传播科学,2024, 12(1): 23–28[6].
[5]曾强清. 基于电影消费者在线评论的情感分析及网络营销策略研究[J]. 电子商务评论, 2025, 14(7): 2049–2057[7].
[6]盘剑. 中国动画“ 出海” 的差异化实践与国际传播效度提升[J]. 人民论坛,2025(6): 6
[7]陈旭光, 张明浩. 互联网新媒介时代中国电影国际传播的新态势[J]. 山东大学学报(哲学社会科学版), 2023, (6): 20–33[5].
三、研究方法与模型构建
3.1 数据来源与预处理
3.1.1 爬虫获取数据
第一阶段通过Python 的Scrapy 框架构建分布式爬虫系统,从豆瓣电影、猫眼专业版、微博三大平台获取《哪吒之魔童闹海》上映首月(2023 年 1 月20 日至 2 月 20 日)的观众评论数据。设置分层抽样规则按城市等级(一线/新一线/二线/三线及以下)分配爬取配额;每日采集时间均匀分布在8:00-24:00 区间。
3.1.2 文本清洗
第二阶段的文本清洗采用分级处理策略。首先进行基础规范化处理,包括:统一全角字符转半角、繁体字转简体(使用OpenCC 工具)、删除 URL 链接及广告文本。随后采用正则表达式清除标点符号,保留中文字符和必要数字。经统计,此步骤使噪声词占比从 12.4% 下降至 3.2‰
3.1.3 Jieba 分词切分
第三阶段的特征提取使用jieba 分词工具进行细粒度切分,加载自定义词典(包含"魔丸"、"敖丙"等128 个动漫专有名词)。停用词过滤采用动态阈值法:计算每个词的TF-IDF 值,剔除排名后 15% 的低价值词汇;同时保留情感词(如"震撼"、"拖沓"等)。最终生成的特征矩阵。
3.2 动态主题模型设计
3.2.1 理论基础
主题模型基于概率图模型构建,给定文档集 DD 中每个文档 dd 的生成过程为
1.从 Dirichlet 分布采样主题分布:
θα ~Dirichlet(x)
2.对文档中每个词位置 nn:
a) 采样主题编号: zd,n ~ Mutttnomtal(0d)
b) 从主题-词分布采样词语:
wd,n ~ Multtnomtal(qzd,n),φk ~ Dtrtcllet(β)
3.2.2 动态性扩展
为捕捉主题随时间 Φt 的演化,引入状态空间模型:
θt~Dirichlet(α+κ⋅θt-1)
其中 κ κ 为平滑参数(本实验通过EM 算法估计为0.57)。主题-词分布φkt? 的更新规则:

Δ t? 为时间衰减因子(设为 e-0.2(t-1) , c(d,k,w) 为文档 d 中主题 k 下词 w 的计数。
3.2.3 模型训练
采用变分推断优化证据下界(ELBO):
L=Eq[logp(w,z,θ,φ)]-Eq[logq(z,θ,φ)]
迭代更新以下变分参数直至收:
·文档-主题分布
·主题-词分布 
3.2.4 主题解释
提取的5 个主题及代表性词例如下( φ 值 >0.05 ):
· T1(视觉特效):3D 渲染(0.083)、粒子特效(0.071)、色彩饱和度(0.062)· T2(叙事节奏):剧情转折(0.078)、节奏控制(0.069)、铺垫不足(0.053)· T3(文化元素):封神宇宙(0.091)、东方美学(0.067)、神话重构(0.058)3.3 受众接受度随机模拟框架
3.3.1 建模理论基础
受众接受度模拟的核心在于建立多维度影响因素的概率模型。本研究基于社会认知理论(Social Cognitive Theory)和计划行为理论(Theory of Planned Behavior),构建了一个包含个体特征、环境因素和认知评估的三层模拟体系。在模型构建过程中,我们采用蒙特卡洛模拟(Monte Carlo Simulation)方法,通过随机抽样技术实现对现实受众群体的概率性仿真。该方法特别适用于存在多重不确定性因素的复杂系统建模,其核心优势在于能够通过大量重复实验揭示系统的统计规律。
3.3.2 模型参数体系
模型的参数体系经过严格的设计和验证,包含以下关键维度:
1.人口统计学参数:
fage(x)=0.6⋅Weibull(x∣λ=2.3,k=1.7)+0.4⋅Unif(18,35)
·年龄分布采用混合概率模型,其中 18-35 岁群体服从参数为λ =2.3 的指数分布,26-35 岁群体服从 μ=30,σ=4 的正态分布。这种双峰结构设计能够准确反映动漫电影受众的年龄特征。
2.地域文化参数:

根据国家统计局发布的城市分级标准,将地域划分为六个层级,并为每个层级分配差异化权重。特别地,模型引入了"文化亲近度"指标,用于量化不同地区观众对传统文化元素的接受偏好。
3.接受度模型构建
接受度(Acceptance)的计算表达式为:
Acceptance O=0 .4Stheme +0.3 Ssentiment+0.2Ddemo +0.1ε
式中各参数定义如下:
(1)主题匹配度(SthemeStheme?):采用余弦相似度度量用户偏好与电影主题的契合程度:

其中向量 u 表示用户历史评论的主题分布(通过LDA 模型提取),向量 Δv 表示电影的主题特征向量。当两者完全匹配时,该指标达到最大值1。
(2)情感倾向值(SsentimentSsentiment?):基于 BosonNLP 情感词典计算评论的情感极性,并进行标准化处理:
ιtiment=X-μσ(μ=5.2,σ=1.8)
原始情感得分 X 经过 Z -score 标准化后,使不同平台的评论数据具有可比性。
(3)人口统计适配度(DdemoDdemo?):通过逻辑回归模型计算:
Ddemo=11+e-(0.3A+0.5R+0.2E)
包含年龄(A)、地域(R)、教育程度(E)三个子维度,系数通过最大似然估计确定。
(4)随机噪声项(ε):
用于模拟未观测因素的影响,服从正态分布:
\sim \matcalwo,0.1)
3.4 模型验证
本研究采用多维度的验证体系对模型进行系统性评估,确保研究结论的科学性和可靠性。验证过程严格遵循机器学习模型的评估规范,同时结合传播学研究的特点,设计了定量与定性相结合的验证方案。

3.4.1 时间一致性检验
通过滑动窗口法评估主题模型的稳定性。将整个观测周期划分为 5 个等长时段,分别计算相邻时段主题分布的余弦相似度。检验结果显示,整体相似度为 0.85( SD=0.03 ),显著高于0.6 的基准值(
。
3.4.2 线性回归验证
建立多元线性回归模型评估预测效度。以受众接受度模拟值为自变量,实际票房数据为因变量,模型调整 R2 达到 0.61( F(1,23)=36.18 , p<0.001 )。进一步分析标准化系数发现:
·主题匹配度的贡献最大( β=0.42 , p=0.002 )·人口统计因素的预测力次之( β=0.31 , p=0.015 )·情感倾向的贡献相对稳定( β=0.28 , p=0.021 )
3.4.3 分群验证
按城市等级进行分组验证,计算模拟值与实际评分的Pearson 相关系数。结果显示:
·一线城市组: r=0.82 ( p=0.003 )
·新一线城市组: r=0.79 ( p=0.008 )
·二线及以下城市组: r=0.71 ( p=0.023 )
3.4.4 Bootstrap 重抽样
采用Bootstrap 法(重复抽样1000 次)评估模型稳定性,结果显示:
·主题数 K 的 95%CI 为[4,6]
·接受度公式权重的变异系数 <0.15
·Jaccard 相似度均值 0.73(±0.08 )
敏感性分析表明,文化亲近度参数的变化对输出影响最大( δ=18.7% ),而随机噪声项影响最小( δ=3.2% )。
四、实证分析(以《哪吒之魔童闹海》为例)
4.1 案例选择
本研究选择《哪吒之魔童闹海》作为研究案例,源于其在国漫电影领域的高关注度与代表性。该影片延续国漫经典 IP,承载本土文化符号,上映后引发广泛讨论,能为探究国漫受众接受度及文化传播提供丰富样本,助力挖掘国漫创作、传播规律。
4.2 动态主题挖掘结果
4.2.1LDA 主题模型构建与优化
在模型构建方面,我们运用LDA 主题模型挖掘《哪吒之魔童闹海》观众评论隐性文本情感与关注焦点。融合显性行为数据(评分、地域等 )与隐性文本,通过迭代调整主题数(经困惑度验证确定最优主题数 ),实现对受众情感倾向、文化认同主题的挖掘,构建“ 特征 - 主题 - 接受度” 的解释框架,捕捉到群体接受度结构性差异与潜在驱动因素。
4.2.2 动态主题演化分析
我们将研究聚焦国漫电影受众,构建了“ 显性特征 - 隐性文化” 分析框架。以《哪吒之魔童闹海》为例,采集豆瓣评论数据,并经预处理构建数据库。通过随机模拟生成特征数据,运用随机森林筛选核心变量,结合动态 LDA 模型,按时间切片追踪主题强度、关键词漂移,对比跨地域文化认知演化。揭示受众情感从“ 视觉震撼” 到“ 文化共鸣” 的递进规律,验证“ 文化折扣” 理论,为 国漫创作分层、营销分阶段及跨文化传播优化提供支撑,推动了受众研究与文化传播理论深化。
4.3 随机模拟输出与验证
我们采用随机模拟生成观众特征(年龄、地域、文化背景 )、评论及接受度得分。年龄方面,核心年龄段(30 - 39 岁 )用截断正态分布(Agecore
σ =3 ) ,取值范围[30,40] ),非核心年龄段(15 - 29 岁、40 - 55 岁 )用均匀分布(Agenon - core~ Uniform([15,29]∪[40,55] ) ;地域按中国电影市场票房特征,将城市分四类,以一线城市占比 40% 、新一线城市 30% 、二线城市 20% 、三、四线城市 10% 的概率加权生成;观众评论假设主题按 Dirichlet 分布( Θi=Dir(aα) ),从文档 - 主题、主题 - 词语分布抽取生成;接受度得分通过条件逻辑调整与随机扰动结合,量化年龄、地域影响。
五、研究发现与未来展望
5.1 主要研究发现
(1)受众特征与接受度的异质性关联显著??随机森林特征重要性分析表明,年龄与地域是影响接受度的核心变量。具体而言,30-39岁核心年龄段观众对本土文化符号的接受度显著更高;一线城市观众因文化包容性与消费场景多元性,对影片“ 视觉特效” 与“ 文化创新” 维度的评分更高,而非核心年龄段(如15-29 岁、40-55 岁)及低线城市观众则受限于内容理解门槛或文化传播氛围,接受度相对较低。
(2)文化认同主题的动态演化揭示“ 情感共鸣” 递进规律??
动态LDA 主题模型追踪结果显示,影片的文化认同主题随时间呈现从“ 表层视觉体验”向“ 深层文化符号共鸣” 的递进规律。这一演化过程验证了“ 文化折扣” 理论在国漫领域的适用性——本土文化符号的深度植入可有效降低跨文化传播中的理解壁垒,增强情感联结。
(3)随机模拟框架验证了多维因素对接受度的综合影响??
基于社会认知理论与计划行为理论构建的随机模拟模型显示,主题匹配度(用户偏好与电影主题的契合程度)、人口统计适配度(年龄、地域、教育程度的综合影响)及情感倾向值(评论情感极性)是决定接受度的三大核心因素。模型验证结果进一步支持了该框架的科学性与解释力。
5.2 实践意义与研究的局限性?
5.2.1 实践意义??
本研究为国漫创作与传播提供了数据驱动的决策依据。在创作层面,需强化本土文化符号与现代叙事逻辑的融合,针对核心受众(设计分层化内容支线,同时降低非核心群体的理解门槛;在营销层面,应依据动态主题演化规律,分阶段聚焦关键话题,并针对不同地域市场制定差异化策略。
5.2.2 研究局限性??
数据范围限制:样本仅涵盖《哪吒之魔童闹海》上映首月的评论数据,未纳入长期口碑演化(如上映半年后的受众反馈),且数据来源集中于国内平台,缺乏海外观众的直接调研数据。
模型假设简化:随机模拟中对 “ 文化亲近度” 的量化采用城市分级代理变量,未能完全捕捉个体文化背景的异质性;动态 LDA 模型未纳入跨文化对比维度,难以直接推导国际传播的适配机制。
5.3 未来研究方向与展望
(1)跨平台数据融合与多模态分析??拓展数据来源至短视频平台(如抖音、B 站)、直播平台及线下观众调研,结合文本评论、弹幕、视频打卡等多模态数据,构建更全面的受众行为画像
(2)动态文化传播机制的长期追踪??
延长研究周期至影片上映后1~2 年,结合国际传播数据(如海外平台评分、跨文化评论),分析文化认同主题的长期演化规律。
(3)多案例对比与普适性模型构建??
未来需进一步拓展数据维度、延长研究周期、深化跨文化对比,以推动国漫从“ 现象级爆款” 向“ 可持续产业生态” 的跨越。
课题来源:该文章受到大学生创新创业训练计划项目资助,课题名称:基于动态主题模型和随机模拟的国漫电影受众接受度建模研究,课题号:S202511047152X