演化博弈视角下知识付费平台激励机制研究
作者: 刘德文 闵凉宇 高维和
[摘要]针对知识付费领域消费者版权意识不足,知识付费分销商(即知识付费平台)监管缺位从而引发的盗版猖獗问题,构建了知识生产者、知识分销商和消费者的三方利益主体的行为决策演化博弈模型,利用Matlab软件进行仿真,分析了各主体策略抉择的影响因素与策略稳定。结果显示:增大对知识生产者的创作利益激励和机会损失有助于知识生产者高效创作;知识分销平台应制定恰当的利益激励机制才能保障演化稳定市场环境下知识付费平台的有效构建;降低正版知识产品的价格,并增大对盗版产品的监督力度可有效促进消费者为知识产品进行消费稳态的实现。研究结论为知识分销商有效提高生产者的创作热情和保障知识付费市场的稳态提供了有效建议,知识分销商可为激励生产者和消费者提供更多的利益分配。
[关键词]知识付费;三方博弈;演化稳定;激励机制
一、 引言及文献综述
知识付费是一种买卖双方通过电子知识分销平台自由定价而直接完成交易的知识产品新型销售模式[1]。作为一种新兴商业现象,知识付费可以有效地降低个体生产者的分销成本,并通过个性化分销的方式释放普通个体的创作热情[2],故而在中国取得了跳跃式的增长。由于知识产品的无形性和重复使用性,其固有风险来自知识产品的黑产运作[3-4],即某些消费者通过黑产运作商以极低成本获取与正版同质的知识内容。据企鹅智酷的行业调研报告,55.3%的消费者通过其他渠道获取过知识内容产品1。尽管相关平台不断加大力度打击盗版,但通过翻录付费内容音频、截图转存付费知识图文等方式进行贩售的盗版课程仍层出不穷。消费者对盗版的选择不仅损害了平台企业的利益,也打击了生产者进行知识产品创造的热忱,从而危及整个知识付费市场的良序发展[5]。因此如何有效监督和减少消费者的盗版寻求行为,并激励生产者积极创作成为管理知识付费市场的重要议题。
知识付费分销平台桥接了知识生产者和消费者两端,其中包含着多方利益群体的复杂关系。除却分销平台本身可以实时掌握和了解知识生产者和消费者的行为,知识生产者和消费者都存在着一定的信息不对称问题,知识分销平台和知识生产者无法控制消费者的平台外行为(如获取盗版知识付费产品),从而损失相应的平台利益[6],这不利于知识付费市场的稳定和长远发展。同时,知识生产者作为整个产业链的源头,他们是否积极产出内容,并与平台积极协作决定着平台的兴衰。因此,协调好知识生产者、知识分销平台以及消费者三方之间的关系,对于促进我国知识付费市场繁荣发展,完善知识付费分销体系具有重要意义。
相关研究主要从知识付费消费者和平台两个方面展开。在知识付费消费者端,大量研究聚焦于探讨消费者行为的特征和驱动因素。消费者的电子内容产品的购买行为存在着理性羊群效应,并且一些显性的产品特征(如是否上榜)会显著地减弱消费者不理性的追随行为,但是作者名誉和竞争会加剧羊群效应[7]。基于价值感知多样性理论,消费者类型(专家消费者或者新手消费者)和历史购买经验会造成消费者对知识付费产品的差异化价格感知,并影响其交易行为[8]。感知有用性、期望确认、系统/服务/信息质量[9]以及感知互惠信念和感知信任在消费者形成付费意向认知过程中具有一定作用[10]。蔡舜等则聚焦于知乎Live这一知识付费的典型代表,发现作为一种成本和信号的混合,价格对电子内容产品的负向影响显著;但是当口碑量足够大时,这种负向影响会得到削弱[11]。在平台研究方面,学者们针对平台资源、激励和网络关系等进行了探讨。在有限理性的前提下,平台适当的奖惩措施有利于规范消费者和商品零售商的行为[12],同时作为桥接交易双方的中介,平台可通过信号机制和担保机制对交易双方行为起正向约束作用[13],并促进不同节点的网络连接和信息交互,从而更好地创造价值[14]。尤其是内容型平台的繁荣更依赖核心用户的参与和协同,并充分发挥用户协作的自组织性,在此过程中平台需要不断优化,提高用户对其的易用和可用感知[15],同时提高社群中心性也可以起到良好的激励作用[16]。
通过梳理文献发现,由于缺少消费者平台外行为的相关数据等原因,现有的研究较少将知识付费的供给双方(生产者和消费者)置于一个框架进行分析,如何同时维持和激励知识生产者的不断产出和消费者对正版知识产品的选择亟待关注[17]。演化博弈作为一种假定行为方有限理性,并可以用于同时研究各个主体行为策略之间相互影响的工具得到了学者们的重视和关注,并广泛运用在各个领域的管理学研究中[18]。鉴于此,本文借助演化博弈和理论,构建知识生产者、知识分销商和消费者的三方主体的有限理性行为演化博弈模型,分析各参与主体的策略稳定性,研究不同参数的不同赋值对演化稳定性的影响,验证可以通过合理设计激励机制,来提高知识生产者的创造热情和消费者选择正版产品的概率,为知识付费市场稳态实现提供新的实践思路。
二、 模型建立和分析
1. 基本假设
在知识付费的背景下有3个利益相关方:知识生产者(如喜马拉雅的主播)、知识分销商(如喜马拉雅平台)和消费者。三方的行为策略并非一成不变,均具有有限理性,同时以追求本身利益最大化为目标。三方策略的选择分别为知识生产者(努力,不努力),知识分销商(积极合作,消极合作),消费者(购买正版,寻求盗版)。
(1)知识生产者的参数
[a1]:知识生产者的基本收益,即知识生产者未采取努力策略而通过售卖相应知识产品获得的收益,而当消费者寻求盗版时,知识生产者将得不到该收益;
[c1]:知识生产者的基本成本,即知识生产者进行生产的最初始成本,如生产者为了生产知识付费产品要租用设备和软件等;
[∆c1]:知识生产者采取努力策略时的额外成本,如生产者为了提高产品质量,会聘请专业公司进行服务;
[π]:知识生产者的机会损失,由于知识付费市场的竞争激烈,产品同质化严重,知识生产者没有努力时,消费者想要购买正版就会转移到其竞争对手方,因此产生相应的机会损失;
[β1]:知识生产者选择努力策略时,给自己带来的额外收益,如得到更多消费者的认可或者平台曝光等;
[β2]:知识分销商选择积极合作时,提供给知识生产者的激励,如给予生产者的创作补贴和扶持费用等。
(2)知识分销商的参数
[a2]:知识分销商的基本收益,即知识分销商未采取积极合作时通过知识付费产品的分销而产生的收益,同样,当消费者寻求盗版时,知识分销商将不会获得该收益;
[c2]:知识分销商的基本成本,即开设分销平台相应的场地、域名和人员费用;
[∆c2]:知识分销商选择积极时的额外成本,包括平台的营销、宣传、推广、激励、补贴和法务等费用和支出,同时分销商选择积极时的额外费用也包括提供给知识生产者的激励[β2]和消费者的额外激励[∆a'3];
[β3]:知识分销商积极合作时的潜在收益,即知识分销商采取积极合作时会有效促进知识生产者的努力和消费的正版消费,带动平台的繁荣,从而使得平台产生诸如广告收入、关联业务收入、周边产品贩卖等额外收益。
(3)消费者的参数
[a3]:消费者的知识付费产品效用,因为知识付费产品的效用来自于产品内容本身,而不取决于盗版或者正版,例如,消费者在起点网上花钱购买某本电子书和从其他盗版渠道获取这本电子书的效用是相同的;
[∆a3]:知识生产者努力时,消费者所获得的额外效用,如更快地进行更新,呈现体验价值更高的知识付费产品等;
[∆a'3]:知识分销商积极合作时,消费者所获得的额外收益,如喜马拉雅FM曾推出“喜马拉雅818联合大会员活动”,即购买喜马拉雅FM上的知识付费产品会获赠其他平台的会员服务;
[c3]:消费者购买正版知识付费产品所支付的成本,消费者购买盗版产品的成本不影响理论分析,因此假设消费者以零成本获取盗版知识付费产品;
[∆c3]:知识分销商积极时,消费者寻求盗版的损失,主要指平台选择积极合作策略时,会对盗版知识内容进行打击。
基于上文的行为策略和参数的设定,可以得到知识生产者、知识分销商和消费者三方的支付矩阵(表1)。
2. 三方博弈的复制动态
本文继续假定知识生产者努力策略的比例是[x],选择不努力策略的比例[1-x];知识分销商采用积极合作策略的比例为[y],采用消极合作策略的比例是[1-y],消费者购买正版策略的比例为[z],实施寻求盗版策略的比例为[1-z]。根据表1,知识生产的平均期望收益为:
由此可得,知识生产者选择努力策略的复制动态方程为:
同理可得,知识分销商选择积极合作策略的复制动态方程为:
消费者选择购买正版的复制动态方程为:
3. 均衡分析
为了求解演化博弈的均衡点,令公式(1)(2)(3)等于0,即:
已知上述联立方程组的解构成了演化博弈的边界,并且还存在如下均衡解:
对于知识生产者、知识分销商和消费者三方群体演化,可用相应的微分方程来分别描述,但动态过程中究竟会趋向于何均衡点不能直接判断。按照Hirshleifer的概念,当动态的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点时,那么称此平衡点为演化均衡点[19]。下面根据雅可比矩阵定性分析系统在这些均衡点的局部稳定性。雅克比矩阵为:
根据李雅普诺夫间接法[19],系统内存在8个特殊的均衡点,分别为(0,0,0),(0,0,1),(0,1,0),(0,1,1),(1,0,0),(1,0,1),(1,1,0),(1,1,1),上述8个均衡点的3个特征值及其符号表示如表2所示。
由表2,点[E8(1,1,1)]成为渐近稳定点的充分条件是同时满足[∆c1<π+β1],[c3<∆a'3+∆c3],[β3>β2+∆a'3+∆c2]。同理,除了点[E1(0,0,0)]的特征值均为负之外,其他7个点的特征根均有正值。
此外,当满足[x1-x=0 x=∆a'3z+∆c2+β2β3zz1-z=0 ]时,假定存在解[(x1,y1,z1)],则此时雅克比矩阵为
易得该矩阵[J]始终存在某一个特征根[λ=0],由此可判断[在(x1,y1,z1)]的平衡状态下不存在渐近稳定点。
进一步,若满足[x=∆a'3∆c1+(π+β1)(∆c2+β2)∆c1β3y=c3∆a'3+∆c3z=∆c1π+β1],设联立方程组存在解[(x2,y2,z2)],则此时雅克比矩阵为:
经计算可得,该矩阵的特征值的限定条件为[λ1+λ2+λ3=0],则此矩阵必然存在非负特征值,故而在[(x2, y2, z2)]均衡状态下也不存在渐进稳定点。知识生产者、知识分销商和消费者的三方动态博弈中,有且只有[E1(0, 0, 0)]和[E8(1, 1, 1)]两个渐进稳定点。[E1(0, 0, 0)]是渐进稳定点,而[E8(1, 1, 1)]成为渐进稳定点则需满足以下特定条件:第一,知识生产者努力的额外成本小于其努力的额外收益和不努力的机会成本之和;第二,消费者购买正版知识付费产品的成本小于其寻求盗版时的损失及分销商给予消费者购买正版激励之和;第三,当知识付费平台繁荣时,知识分销商所获收益要大于其给予知识生产者、消费者的激励以及积极合作的额外成本。对于渐近稳定的两点,即知识生产者不努力,知识分销商消极合作,消费者寻求盗版和知识生产者努力,知识分销商积极合作,消费者购买正版,取决于最初的博弈状态。
4. 数值仿真
根据上述复制动态方程的边界条件,进行仿真模拟。设立初始时间从0开始,步长为100。将三方策略的初始值设定为(0.5,0.6,0.6)及(0.5,0.4,0.4),其余各参数赋值如下:[π=0.3],[β1]=0.5,[β2]=0.2,[β3=1.6,c3=0.2,∆c1=0.4],[∆c2=0.2],[∆c3=0.3],[∆a'3=0.1]。仿真实验结果如图1所示,说明当知识分销商积极合作的成本[∆c3]较小,并且给予知识生产者和消费适当激励[β2]、[∆a'3],且在知识付费平台繁荣后能够获得额外的收益[β3];知识生产者进行努力的收益[β1]和不努力的机会成本[π]可以覆盖其努力额外成本[∆c1]时;消费者购买正版产品的成本[c3]小于其寻求盗版产品的潜在损失[∆c3]和购买正版的额外激励[∆a'3]时,就会趋向于稳定点(1,1,1)的状态。需要指出的是,这一状态取决于初始状态中,消费者购买正版产品的概率大小。在第二种初始值设定下,即消费者购买正版知识付费产品的概率是0.4,即使知识生产者有大比例采取努力策略,也会最终导致系统收敛于稳定点(0,0,0)。