基于大数据的文旅消费集聚区、旅游休闲街区空间客流和消费测算模型研究
闫单单 王洋 裴旭
河北省文化和旅游创新发展中心 河北石家庄 050000
1. 文献综述
自文化和旅游部开展国家 费集聚区建设工作后,关于文旅消费集聚区、旅游休闲街区的相 布特征、文化特征、游客满意度等方面。如运用 GIS 空间分析方 间分布格局及影响因素进行研究 [1],通过实地调研并采用 [2] 等。也有学者提出旅游休闲街区的建设思路,指出要结 进行顶层设计,发挥各街区的独特性和互补性,激发其发展活力
目前对客流量的研究多采用计 智能算法对客流量预测。部分学者探索使用大数据提高预测精度,如引入百度指数,采 测 提高预测精度[4]。在旅游消费方面的研究,多集中在旅游消费对经济的影响、 多采用问卷调查及统计数据分析的方法。有学者详细分析了旅游消费升级的发展现状及其对旅游产业经济效益、社会效益和环境效益的影响 [5]。
总之,目前对文旅消费集聚区、休闲街区的研究多采用定性分析方法,没有对客观的旅游统计数据进行分析。而对客流量、旅游消费方面的研究,没有充分发挥大数据和信息技术的优势。本研究通过运用游客位置识别技术、消费大数据信息采集技术,可以完善旅游统计指标体系,提高数据的有效性、及时性。
2. 相关概念界定
2.1 文化和旅游消费集聚区、旅游休闲街区空间的界定
文化和旅游消费集聚区、旅游休闲街区是按照《文化和旅游部办公厅关于开展第一批国家级夜间文化和旅游消费集聚区建设工作的通知》所要求的“四至范围明确、业态集聚度高、公共服务完善、品牌知名度较高、市场秩序规范良好、政策环境良好”等条件确定,主要包括街区、景区、景点、美丽乡村以及博物馆、美术馆、图书馆、文化馆和剧院等公共文化场馆。按照四至范围确定边界,对边界内的游客接待数量、消费支出水平进行统计。
2.2 文化和旅游消费集聚区、旅游休闲街区时空客流的界定
2.2.1 游客的界定
文化和旅游部对游客的定义,是指离开惯常环境,出游时间超过 6 小时,但不足 12 个月,出行距离超过10 公里,到其他地方游览观光、休闲度假、探亲访友、医疗康养、购物娱乐、学习交流、会议培训或开展经济、文化、体育、宗教等活动的居民。从该定义可以获知,须从时间范围和空间范围界定游客的统计口径。参考该定义,并结合文化和旅游消费集聚区、旅游休闲街区客流的特殊性,按以下时间、空间口径对游客界定。
第一,在时间上,主要是指游客在集聚区或休闲街区的停留时长。游客在集聚区或休闲街区“从进入、消费到离开”的时间长度取决于多种因素,在实际操作过程中,考虑海滨度假类、冰雪运动类、文化休闲类等集聚区或街区的特点及差异,并结合游客的具体情况,分别做出时长限制条件。海滨度假类、冰雪运动类须在 6小时以上(含);文化休闲类主要集中在休闲街区,范围有限,如步行街多为 2000 米左右,停留时长须 50 分钟(含)以上即可统计为游客。
第二,在空间上,主要是从游客的出游距离进行界定,考虑到现实可操作性,本研究界定的出游距离为离开惯常环境在 10 公里以上即纳入游客统计范畴。在具体实施时,根据游客实际出游距离和集聚区、休闲街区驻留时长,考虑多种距离标准进行对比分析,最终选择合适的空间标准。
2.2.2 游客数量。指符合一定时间、空间标准,具有旅游动机且与目的地不形成雇佣关系的人员数量。每出游1 次统计1 人次。
2.2.3 游客构成。包括游客年龄、性别、职业、身份、国籍、来自地区以及旅游组织方式(团体游客、散游客)等。
2.3 文化和旅游消费集聚区、旅游休闲街区游客消费支出水平指标界定
2.3.1 游客消费支出。主要是指游客为了取得文化、旅游及相关产业主体所提供的文化和旅游服务等支出的金额。
2.3.2 消费支出构成。根据《文化及相关产业分类(2018)》和《国家旅游及相关产业统计分类(2018)》所规定行业标准对相关街区、集聚区范围内的产业进行分类。将消费支出分为出行、住宿、餐饮、游览、购物、娱乐休闲等。
3. 算法模型编制
3.1 调查方法与指标选取
3.1.1 游客数量。基于手机信令与位置信息等大数据技术确定游客总体规模,并采用问卷调查、住宿登记信息、门票销售、商户销售记录等多种数据采集渠道,准确把握街区、集聚区游客数量。考虑淡旺季、节假日对游客数量的影响,调查时按经营周期进行分层抽样,以减小估计误差。
3.1.2 游客消费支出。从经营主体和游客两方面获取数据。对经营主体,采取抽样调查的方式对代表性强的文化和旅游消费集聚区、旅游休 旅游 收入及构成等情况进行收集。考虑不同产业类别消费水平的差异,调查时按产 分层抽样 以减小估计误差。综合考虑线上线下不同消费渠道的差异。线上主要结合携程 线下主要针对银联、支付宝、微信扫码等支付信息测算。对游客,通实地抽样调查对 费 行为的游客占比、消费水平及构成、各消费渠道占比等进行测算。
在测算过程中,关注文化休闲类、海滨度假类、冰雪运动类等旅游街区、消费集聚区的人均消费水平差异分类调查与统计,最终再求和汇总。
3.1.3 指标选取。根据所要研究的客流量及消费支出预测目标,以及数据可获得性,确定指标选取结果

3.2 模型构建3.2.1. 游客数量及结构估计方法首先,采用分层抽样调查方法,按照淡旺季、节假日等将经营周期划分为不同层,对各经营周期内的游客
数量及比例分别进行抽样调查。根据问卷调查结果并结合住宿登记信息、商户销售记录等综合测算观测期内的游客数量y 及构成。i=1,2,…n,其中n 为调查天数。
其次,根据观测周期内手机信令位置信息数据,测算游客总体规模 Xi ;
再次,计算两者比率pi :

最后,根据比率估计公式测算文化和旅游消费集聚区、旅游休闲街区游客总量Y :

其中,X 为经营周期内由手机信令所确定的文化和旅游消费集聚区、旅游休闲街区游客总体规模。
3.2.2 游客消费支出水平估计方法
首先,对经营主体采用分层抽样调查的方式调查游客消费支出,按产业类型分层,每个产业类型中按照大中小划分为三层,分消费支出类别测算人均(次)消费水平。根据观测周期内商户“银联”信息、各渠道消费占比、消费人次与到访人次,测算各消费支出类别的人均(次)消费水平
及占比:

其中, cij 为第 i 支出类别中第 j 消费者的支出金额,i=1,2,…,m 表示吃住行游购娱等消费类别,qc、qv 分别为观测时间周期内所统计的消费人次和到访人次。
其次,由吃住行游购娱等各类消费支出的人均消费水平
计算人均(次)总消费支出水平
:

最后,结合游客数量测算游客消费总支出:

各类消费支出的占比为

4. 实证分析
结合全省文化和旅游消费集聚 山河头老街为例,运行模型算法,检验模型 信令剔除职住人员后的数据与同期 比率为 0.83。据此计算游客总量,1-9 月 与官方公布数据十分接近。消费支出 额,并结合携程、美团等平台订单数据, 宿和餐饮为主,合计占比65%,文化娱乐消费 上订单。通过试点算法,充分检验了模型指标选择的科 合理性和可操作
5. 总结和展望
本研究成功构建了基于大数据的文旅消费集聚区、旅游休闲街区空间客流和消费测算模型,通过“概念界定- 数据采集 - 模型构建 - 应用验证”的全流程框架实现了对文旅空间客流与消费的精准测算,为文旅产业的精细化管理提供了有力支持。但还有很多不足之处,比如不同类型的消费集聚区、休闲街区还存在很大差异。下一步,要进一步结合腾讯等地图电子围栏大数据平台不断修正算法模型,为进一步出台扩大内需、激发文旅消费潜力的相关政策提供依据。
参考文献
[1] 王子迪 , 侯建楠 . 国家级夜间文化与旅游消费集聚区空间分布格局及影响因素研究 [J]. 西华师范大学学报 ( 自然科学版 ),2024,45(02):199-206.
[2] 朱玺 , 刘敏 . 旅游休闲街区夜间旅游满意度影响因素研究 [J]. 旅游论坛 ,2023,16(06):40-54.
[3] 庞玮 , 白凯 . 我国国家级旅游休闲街区发展实践的学理审视 [J]. 陕西师范大学学报 ( 自然科学版 ),2024,52(04):27-37
[4] 王 云 龙 , 彭 颖 . 基 于 百 度 指 数 的 EEMD-BES-ELM 旅 游 客 流 量 预 测 [J]. 电 子 技 术 与 软 件 工程 ,2022(24):205-209.
[5] 韦美玉 . 旅游消费升级对旅游产业效益的影响分析 [J]. 全国流通经济 ,2024(06):169-172.
作者简介:闫单单(1991—10),女,汉,河北沧县,中级统计师硕士研究生,研究方向:统计调查与数据分析,邮编:050011。
王洋(1987-05),女,汉,河北望都,高级工程师硕士研究生,研究方向:文旅信息化、文旅科技创新相关研究,邮编:050011裴旭(1981-03),男,汉,河北肃宁,副研究馆员硕士研究生,研究方向:数字资源建设与管理,邮编:050011
基金项目:本文系2024 年度河北省文化艺术科学规划和旅游研究重点项目成果
项目批准号:HB24-ZD007