您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[慧科讯业]:2023慧科-香港科技大学-旅游指数白皮书 - 发现报告
当前位置:首页/行业研究/报告详情/

2023慧科-香港科技大学-旅游指数白皮书

休闲服务2023-08-21慧科讯业叶***
2023慧科-香港科技大学-旅游指数白皮书

慧科-香港科技大学旅游指数 WISERS-HKUSTTourismIndex Dr.JingxinZhao1,YuXiong1,GuancongRen1,Dr.HelenaLau1,Dr.ChaoHe1 Prof.AllenHuang2,Prof.Kai-LungHui2 1.WisersAI 2.HKUSTBusinessSchool Lastmodifiedon:[2023-07-30] ©2023WisersInformationLimited Theinformationcontainedhereinisconfidentialandproprietaryandshouldnotbedisclosed,copiedorduplicatedinanymannerwithoutwrittenpermissionofWisersInformationLimited. 执行摘要 本白皮书介绍了由慧科讯业与香港科技大学商学院合作研究的香港旅游业项目,即基于社交媒体大数据及线下旅游业统计数据而计算得�的实时预测性指数,慧科-香港科技大学旅游指数(简称:慧科-港科大旅游指数)。 香港旅游业是香港四大支柱产业之一。然而,受到2019年社会运动和2020年新冠疫情的影响,香港的旅游业遭受了前所未有的考验,2023年2月香港与内地通关,旅客往来香港内地无需入境隔离,香港政府也推�一系列鼓励游客到访香港的措施,香港旅游业迎来新的转机,在此之际,分析能够影响未来香港旅游业的因素,不管是对香港政府还是旅游商业,都十分重要。做为香港旅游业的主要市场,在2019年,中国内地的旅客占全部访港旅客的78.29%。此次项目也以中国内地旅客为研究对象。 本项目旨在通过构建一系列慧科-港科大旅游指数来对未来香港旅游业进行预测。不同于以往旅游业学术论文使用旅客问卷或专家小组的方式进行研究,我们首次使用了大数据建模的方式,利用来自慧科社交媒体大数据及线下旅游业统计数据来构建预测模型。 通过对大量以往旅游业相关学术论文的研究,并结合香港旅游业的本地特点,我们定位了6大旅游因素,分别为到访方法,设施,景点,娱乐活动,当地社群和附带因素。在慧科全景智能大数据平台上,我们可以获取内地旅客经常使用的社交媒体数据,包括新浪微博数据,线上旅行机构数据,旅行相关论坛数据和其他热门社交媒体的数据,如百度贴吧,马蜂窝,小红书,抖音等。这些媒体的数据总量超过1000万条/天。为囊括不 同的时期和各类重要事件,我们选择了2018年1月至2023年3月做为此次研究的时间范围。通过对这五年多的数据进行分析研究和比较,我们对香港旅游业经历的变化获得了一个系统的认知,也计算�了全面且稳定的一系列预测性慧科-港科大旅游指数。 经过初步的数据清洗和分析后,我们将上述6大因素进一步细分为11个模型自变量,分别为到访方法-交通,到访方法-签证,设施,景点,当地社群-正面,当地社群-负面,娱乐活动-购物,娱乐活动-运动,娱乐活动-文娱,娱乐活动-展览,以及附带因素。同时,我们选择了9个可能影响香港旅游业的外因变量,分别为公众假期,学生寒暑假期,港币人民币汇率,香港社会运动-实际发生,香港社会运动-内地媒体大量报导,香港内地通关政策,月份,气温,以及环境-空气质量。我们将对香港酒店入住率、香港访港旅客人数和香港酒店平均价格分别进行分析预测。 本项目利用慧科自主研发的自然语言处理技术和机器学习模型,将以上数据进行处理和量化,最终采用随机森林回归预测模型。同时,我们研究了对不同时间点的未来数据进行预测的效果,得到兼顾预测性和实时更新性的一系列慧科-港科大旅游指数,最终预测结果的误差率可低至4%。 通过本项目的成果,香港政府及旅游业界将获得对未来香港旅游业相关数字和趋势的精准预测,调整落实紧跟时事的旅游业相关政策,及时更新商业决策及计划。 ©2023WisersInformationLimited Theinformationcontainedhereinisconfidentialandproprietaryandshouldnotbedisclosed,copiedorduplicatedinanymannerwithoutwrittenpermissionofWisersInformationLimited. 目录 1.项目任务介绍4 1.1背景介绍4 1.2研究目标:慧科-港科大旅游指数4 1.3研究团队4 2.项目方法论5 2.1数据理解和采集5 2.2变量设计和提取7 2.3数据处理和量化9 2.4模型建立10 3.结果展示12 3.1预测结果13 3.2模型评估14 3.3模型解释15 3.3.1酒店入住率预测模型15 3.3.2到访人数预测模型17 3.3.3酒店价格预测模型20 3.4慧科-港科大旅游指数21 4.总结23 ©2023WisersInformationLimited Theinformationcontainedhereinisconfidentialandproprietaryandshouldnotbedisclosed,copiedorduplicatedinanymannerwithoutwrittenpermissionofWisersInformationLimited. 1.项目任务介绍 1.1背景介绍 旅游业是香港的核心产业之一,其中来自中国内地的游客更是占全部访港旅客的绝大多数;2019年,从中国内地入境香港的旅客人数达到了总旅客人数的78.29%。 受到疫情封关的影响,相比于2019年,2020年的访港旅客人数骤减99.8%,香港旅游业遭受严重打击,许多服务于旅游业的香港人失业。2023年2月香港与内地通关,游客往来相关和内地无需隔离,政府亦推�一系列吸引游客的措施,在此情况下,能准确的定位和分析影响香港旅游业的因素显得尤为重要。 分析和预测离不开数据的支持,社交媒体平台是内地访港旅客最常用的分享和交流旅行信息的平台,而慧科拥有丰富的社交媒体数据源和成熟的自然语言处理及数据分析技术。在此项目中,我们意在根据社交媒体大数据来构建一个具备预测能力并能实时更新的旅行热度指标,为香港政府和旅游商业洞悉重要信息,帮助决策。 1.2研究目标:慧科-港科大旅游指数 慧科-港科大旅游指数是一个直观便捷,并具备实时月度更新性质的预测性指标。慧科-港科大旅游指数拥有完整的理论框架支持,囊括超过20种旅行相关的影响因素(如交通,景点等),依靠用户原创内容作为大数据支持,能够为我们的客户提供准确的预测,帮助客户获得及分析未来的旅行相关数字和趋势 (如下个月的旅客到访人数等)。 慧科-港科大旅游指数的主要受众为政府和酒店等旅游相关商业。对于政府,慧科-港科大旅游指数的预测能力能够协助其调整未来的旅游业相关政策并落实到相关部门(如入境处等)。对于旅游相关商业,慧科-港科大旅游指数的实时更新性能够紧跟时事,季节,及假期的变化,为客户提供第一手的预测性商业信息,让其能够根据预测更新或提前安排商业计划。 1.3研究团队 本项目由慧科AI部门(WisersAI)与香港科技大学商业及社会资讯分析研究中心合作完成。 WisersAI,前身为WisersAILab(慧科AI实验室)2014年7月成立于香港,专注于以人工智能技术解决中文全媒体资讯自动化分析与大数据情报挖掘。目前拥有20余位毕业于欧美及中港台知名院校的AI及计算语言学专家。所有成员均拥有硕士以上学位,其中35%的成员拥有博士学位。WisersAI依托慧科20 ©2023WisersInformationLimited Theinformationcontainedhereinisconfidentialandproprietaryandshouldnotbedisclosed,copiedorduplicatedinanymannerwithoutwrittenpermissionofWisersInformationLimited. 多年积累的全球数一数二且不断增长的中文全媒体信息数据库及语义资源,以人工智能与大数据技术为驱动,专注研发面向实际应用的开放领域多元化数据AI分析技术,实现从跨媒体的海量数据流中及时发掘与识别对客户最重要、最有价值、及最相关的资讯情报。自主研发的全面涵盖自动化媒体情报处理与挖掘的自然语言处理及人工智能技术包括:命名实体识别、情感分析、话题分类、文章聚类、图像识别等,拥有10多项国际发明专利及奖项。 香港科技大学商业及社会资讯分析研究中心(CBSA)应用最先进的统计、计量经济学、机器学习和人工智能工具于分析新兴的大数据趋势以产生商业和社会洞察力,并作为协作大学学者、商业组织、非政府组织和智库的研究人员之间的平台,为专业和普通受众分析商业和社会历史,案例及问题。具体来说中心将收集和分析来自传统媒体、文献、及社交网络的用户生成数据,适时进行行业调查和民意调查及分析以提供创新的商业和社会见解。这些见解和建议将有助于香港和大中华地区的经济和社会发展。 2.项目方法论 2.1数据理解和采集 在预测旅游业数据的研究里,最基本也是最重要的步骤之一为定位和分析能够影响未来旅游业数据的关键因素。在此次项目中,慧科团队对大量过往相关文献进行了研究,并注意到,在过去的旅游产业相关学术报告中,尽管不同研究所提�的能够影响旅游业的因素不尽相同,但最为关键的几个因素基本一致。2017年Reitsamer等人以旅客问卷方式进行研究,将到访方法,设施,景点,娱乐与当地社群作为关键因素进行分析。在Lee等人于2010年的研究中,以专家小组分析的方式,将到访方法,设施,景点和辅助服务作为关键旅游因素。同样以专家小组分析进行研究的,Deng等人在2002年的研究中,将交通,便利设施,景点,当地社群和周边景点定位为能够影响旅游业的关键因素。值得注意的是,在1998年Kim以旅客调查采访的方式进行的研究中,除去上述因素外,还将环境洁净程度,季节性景观等因素加入研究;同时将设施,娱乐等因素进一步细化为休闲设施品质,家庭型旅行设施及其安全性等细分因素。而在最早的1974年Gearing等人的专家小组研究中,则是以较为概括的概念,分析了食物,自然,社会,历史,及购物五大因素。 综上我们可以看到,尽管在过往的学术研究中,时间和空间的跨度很大,但这些研究提�的能够影响旅游业的因素大体类似。在此次项目研究中,我们总结了各文献中通用的旅游业因素,并结合了香港本地特点,定位了六个能够对香港旅游业起到重大影响的关键因素,分别为到访方法,设施,景点,娱乐活动,当地社群,和附带因素。 ©2023WisersInformationLimited Theinformationcontainedhereinisconfidentialandproprietaryandshouldnotbedisclosed,copiedorduplicatedinanymannerwithoutwrittenpermissionofWisersInformationLimited. 因素名称 定义 包含内容 到访方法 旅客到访香港的方式 旅行签证,交通 设施 住宿,餐厅,及基础设施 酒店,餐厅,物价,旅客服务及旅行指示,水电Wi-Fi等 景点 自然景观,人文景点,及季节性景点等 历史景点,传统渔村,户外行山,主题公园,博物馆,当地名吃等 娱乐活动 广义社会文化性旅游资源,所有室内室外活动 购物,体育运动,文化娱乐,展会展览,夜生活等 当地社群 访港旅客对香港本地人/社群的观感 安全/治安,当地人友好程度 附带因素 除去上述五大类外,吸引旅客访港的附带因素 其它访港原因,如注射HPV疫苗、购买保险等 在收集数据的方法上,我们注意到文献基本都采用了旅客问卷调查或专家小组分析。这两种方法相对比较简便直观,但无法为一个预测指标来提供更实时客观的信息。随着大数据技术的不断发展,学者们对大数