基于Airbnb数据的旅游共享住宿信任机制分析
作者: 李佳珂 曾清清
摘要:共享经济迅猛发展的同时,共享住宿已经成为人们旅游不可或缺的住宿方式。Airbnb作为全球最大的共享住宿平台,通过点对点方式提供旅游住宿,房东发布房源消息,房客查询并预定房源。文章围绕Airbnb共享数据的特点,采用Python爬虫爬取共享房源的关键信息,包括评论信息、房源信息、经纬度信息等,然后采用LocalSpace Viewer进行地图标记,方便对Airbnb数据进行展示。另一方面,针对共享住宿信任机制,以Airbnb数据分析结果为基础,分析了回归树、空间相关性等方法对共享住宿信任机制的影响。
关键词:共享住宿;信任;Airbnb平台;共享经济
中图分类号:F590 文献标识码:A
文章编号:1009-3044(2022)20-0016-04
1 引言
随着经济不断发展,旅游业不断活跃,人们在享受旅游带来的乐趣的同时,不得不承受高昂旅游住宿费用。近年来,依托云计算和物联网平台,共享经济得到不断推进和发展。作为共享经济和旅游业的融合产物,共享住宿也逐渐成为人们关注的热点。据统计,2017年“十一”黄金周,不少旅游者住宿到共享住宿平台提供的房间。据近年来《中国共享经济发展年度报告》结果显示,中国共享住宿业交易额在2020年达到225亿元,在全部住宿业客房收入占比达到6.7%。图1展示了2015—2020年中国共享住宿市场规模变化趋势。图2显示了2016—2020年中国共享住宿收入占全国住宿业客房收入比重变化趋势。由图可见,2018—2019年是共享住宿市场热潮时期,之后共享住宿发展趋向平缓,2020年受新冠肺炎疫情影响,共享住宿市场进入寒冬季。为打破这种僵局,2020年7月,发改委等13部门印发的《关于支持新业态新模式健康发展激活消费市场带动扩大就业的意见》,明确提出鼓励共享住宿,发展生活消费新方式,至此,鼓励发展“共享住宿”首次写入政府文件。
文献[1] 以共享短租平台小猪短租网站的房源数据为例,分析了共享短租平台供给者端的房源及房东特征。该文献分析指出规模化的房东的定价往往高于离散化的房东,另外,共享房源的定价还会受到包括房源位置、配套设施、交通方便性、二手房房价等诸多因素的影响。文献[2]以Airbnb与携程平台为例,对共享与传统住宿平台价值创造因素进行分析。文献[3]则从政府被动反应、政府主动引导和政府与平台合作三种不同监管机制出发,分析了城市共享住宿监管的路径、机制和措施。文献[4]则以Airbnb共享住宿为研究对象,借助空间分析工具,对上海市2010—2019年期间共享住宿位置空间变化进行过了分析,并针对道路密度、经济水平、房源供给、服务群体与空间集聚等因素进行了加权回归分析和研究。文献[5]分析了Airbnb在共享住宿领域里的商业模式创新及其面临的业绩计量难题。文献[6]以Airbnb北京地区的在线短租数据为分析对象,研究了房源定价合理性对房源热度的影响关系。文献[7]2010—2019年北京市Airbnb数据为基础,运用GIS空间分析和空间变差函数方法进行时空演变及集聚特征进行分析。文献[8]则运用TRIZ理论模型,提出了共享住宿标准体系的构建过程及体系框架。文献[9]从小猪短租平台上爬取的北京、上海、广州和深圳等地的6953条有效房源数据,揭示了房客可持续消费行为的影响机制,为提升共享经济中消费者的可持续消费行为提供新思路。文献[10]针对共享住宿文献进行综述分析,指出2012—2015年为萌芽阶段,2016—2019年为发展阶段。文献[11]则对共享住宿中信任的概念、信任的类型、信任研究的理论基础,以及房客、房东视角下信任建立的前因变量、信任的对象和结果变量的剖析。文献[12]则分析了共享住宿发展的信任、监管两个维度,房东、游客、产品和平台四个方面的因素等对共享住宿的影响,探讨了包括案例分析归纳、深度访谈、文本分析、内容分析、结构方程模型、特征价格模型、最小二乘法、固定效应回归模型等研究方法。文献[13]则围绕如何正确引导共享经济健康发展中应对道德风险的挑战,以爱彼迎为单案例进行研究。
2 共享住宿平台Airbnb
民宿日益成为旅游过程中非常重要的一环,然而,很多旅客对于民宿还不是非常熟悉,导致民宿住宿量还不是很高,通过网站搜索可以看到北京某地的民宿信息如图3所示。随着民宿的不断发展,结合共享经济的推进,共享民宿已经成为民宿经济的重要分支。
Airbnb是共享住宿的先驱,其核心思想是采用点对点(peer-to-peer)住宿模式。通过把房东的空余房间与旅行者的住宿需求建立联系,实现了共享住宿,促进了旅游住宿的新发展。自2008年成立以来,Airbnb已经成为覆盖全球190多个国家和地区、涵盖81000多个城市的全球共享住宿平台。2015年Airbnb引入中国,并迅速发展。
2.1 Airbnb数据分析
Airbnb数据针对每个房源主要分为6个板块,即房源详情、评价信息、可订日期、房源位置、旅客须知、房东信息。具体如下:
1) 房源详情:房源名称、卧室数量、床数、卫生间类型和数量、最多容纳旅客数量等;
2) 评价信息:房源收到的评论总数、房源旅客的如实评价信息等;
3) 可订日期:房源最早可预订日期、房源最少入住天数、房源最多入住天数等;
4) 房源位置:房源所在省份、城市,所在经纬度,周边配套公交、地铁、交通信息等;
5) 旅客须知:房源对旅客入住的基本要求、取消预订政策和交易提示、是否禁止携带宠物入住等;
6) 房东信息:房东的名字、联系方式、房东是否为超赞房东、房东收到的总评论数、房东自我介绍等。
表1给出了Airbnb平台上北京某地共享住宿房源的关键信息。图4展示了Airbnb网站展示的北京共享住宿数据。图5展示了中国香港共享住宿部分数据和比率分析。由上述图表可见,相对于民宿信息搜索结果,Airbnb共享住宿平台发布的数据更为详细和稳定。
2.2 地图标记
本文采用LocalSpace Viewer进行地图标记。LocalSpace Viewer是一款集成多种在线地图资源,包括百度地图、天地图、影像、标注。该软件特点是浏览速度快、支持载入天地图影像、腾讯影像等多家影像数据、支持载入天地图地图、标注、道路标注等。以中国香港共享民宿为例,地图标记的具体步骤如下:
第一步,先从Airbnb网站(http://insideairbnb.com/get-the-data.html)下载中国香港共享民宿的数据,找出其中的listings.csv文件;
第二步,打开listings.csv文件,找到经度纬度对应的列,如图6所示。需要注意的是,经纬度数据每一行的位置有时候不一致,需要调整位置;
第三步,复制每个共享住宿的经纬度数据到一个单独的Excel文件,比如Hongkong.xlsx;
第四步,打开LocalSpace Viewer软件,选择工具箱菜单中的“Excel转KML”工具如图7所示,弹出对话框如图8所示;
第五步,在图8对话框中,选择“打开XLS”,选择Hongkong.xlsx,选择经纬度列的编号,然后选择生成点,生成KML文件,显示结果如图9所示。
2.3 爬虫设计
网络爬虫(又称为网页蜘蛛、网络机器人、网页追逐者) ,是一种按照一定的规则,自动地抓取Internet网信息的Python程序或者脚本。通过适当设置需要爬取的特征,网络爬虫可以获得有效信息。本文通过下载Airbnb网络爬虫,爬取了北京共享住宿网站的信息,爬取过程如图10所示。通过爬取数据,获得每个共享住宿的有效信息字段,包括价格、浴室数量、卧室数量、床的数量、网址、可住旅客数量、所在城市、纬度、经度、评分、评论数量、具体评价信息、星级、附加服务信息等。
经过20小时的爬取,获得5543条共享住宿信息,上述信息保存在Excel表格中,通过导入LocalSpace Viewer进行地图标记,结果如图11所示。
需要指出的是,Airbnb网站提供了部分城市的共享住宿地图标记图,但国内仅限于北京、上海、中国香港三地,其他城市Airbnb分布图可以通过本文的方法进行地图标记。
3 共享住宿信任机制分析
共享住宿信任值是一个非常关键的变量,影响了旅客的选择,一般来说信任值受到多个变量的影响[14-17],如表2所示。
3.1 回归树信任机制分析方法
因变量作为信任的重要载体,体现了房客对不同房源的信任度的高低。信任水平高,房客与房东之间更容易建立信任关系。因此,随着共享经济不断发展,信任值越来越体现其重要性。
回归树法是一种比较有效的信任值因素分析方法。具体步骤包括:
1) 采用网络爬虫爬取某地区共享住宿房源的信息,信任相关的要素包括卧室数量、床位数量、最大可容纳人数、总评论数、同类房源平均评论数、差评率等;
2) 计算实际收到的评论数量与同类房源平均评论数的差异率作为信任的替代变量;
3) 建立若干个回归树模型,模型筛选出对信任水平造成影响的主要因素、作用方向、作用强度信息;
4) 分析回归树各级节点,分析出某个信任因素对信任水平的影响度。
3.2 信任机制分析其他方法
与信任机制相关的其他方法还有很多,主要有:
1) 核密度估计
核密度估计主要用于房源点位数据的空间聚集度分析,即共享住宿房源在空间扩散的距离衰减规律。
2) 空间自相关
空间自相关主要用于分析地理位置相近的不同共享住宿房源,描述分析其相关度。莫兰指数是一种评价空间自相关的系数,其含义是用于判别空间是否存在自相关。
空间自相关方法分为全局自相关和局部自相关两类[4]。
[Id=inj≠1nωij(Xi-X)(Xj-X)S2inj≠1nωij(Xj-X)] (1)
[Ii=(Xi-X)Si=1nωij(Xj-X)] (2)
式中:Id为全局相关莫兰指数;Ii为局部区域自相关性;n为所研究房源的数量;Xi、Xj为区域i、j的共享住宿房源密度;wij为空间权重矩阵;S2为区域观测值方差[4]。
4 总结
本文针对共享住宿Airbnb平台的数据进行分析,采用Python网络爬虫进行数据爬取,之后采用LocalSpace Viewer进行地图标记,方便对Airbnb数据进行展示。另一方面,针对共享住宿信任机制,以Airbnb数据分析结果为基础,分析了回归树、空间相关性等方法。 (下转第26页)
参考文献:
[1] 王春英,陈宏民.共享短租平台房东定价行为——基于小猪短租平台的数据分析[J].系统管理学报,2021,30(2):363-372,383.
[2] 张一雯,周恺,和琳怡.城市共享住宿监管的路径、机制和措施研究[J].管理现代化,2021,41(2):64-69.
[3] 李莉,侯国林,夏四友.上海市共享住宿时空格局及影响因素识别[J].人文地理,2021,36(1):104-114,154.
[4] 黄世忠.共享经济的业绩计量和会计问题——基于Airbnb的案例分析和延伸思考[J].财会月刊,2021(1):7-12.
[5] 吴丽花,葛健,薛广阔.共享住宿市场房源定价对房源热度的影响研究——基于Airbnb北京地区的数据分析[J].当代经济,2020(12):54-57.
[6] 夏馨颖,张宏磊,田原,等.北京市Airbnb时空演变特征及其影响因素[J].经济地理,2020,40(11):68-76.
[7] 刘展,臧传胪,肖遥,等.共享住宿标准体系构建探析[J].中国标准化,2020(10):106-112.
[8] 池毛毛,潘美钰,晏婉暄.共享住宿中房客可持续消费行为的形成机制研究——用户生成信号和平台认证信号的交互效应[J].旅游学刊,2020,35(7):36-48.
[9] 李鹏,陈雪钧.国内共享住宿研究综述[J].商业经济,2020(6):49-53.
[10] 牛阮霞,何砚.共享住宿中的信任研究综述——基于房东、房客的视角[J].管理现代化,2020,40(3):112-117.
[11] 胡姗,杨兴柱,王群.国内外共享住宿研究述评[J].旅游科学,2020,34(2):41-57.
[12] 熊怡莹,朱孟婷,赵银龙.共享短租平台道德风险研究——基于爱彼迎(Airbnb)的案例分析[J].经营与管理,2020(1):63-67.
[13] 王红丽,陈茁.共享经济中信任对约车出行意愿的影响机制——基于案例研究的定量分析[J].管理案例研究与评论,2017,10(6):616-632.
[14] 吴光菊.基于共享经济与社交网络的Airbnb与Uber模式研究综述[J].产业经济评论,2016(2):103-112.
[15] 魏可心,潘红.共享经济背景下共享平台与消费者信任形成机制[J].中国市场,2018(16):136-137.
[16] 闫励,牛新艳.我国共享短租市场中的信任研究——基于Airbnb开源数据的分析[J].经济论坛,2020(12):137-147.
【通联编辑:李雅琪】