面向在线社交网络的企业管理决策研究
上QQ阅读APP看书,第一时间看更新

2.6 客户消费金额及终身价值研究

本节将基于前文的研究,首先进行客户消费金额的研究,即采用Gamma-Gamma模型进行客户消费分析。最终从个体层面出发,将消费者的购买价值与评论价值进行综合,构建基于评论行为的客户终身价值计算模型(其中评论价值中涉及的评论金额分析不在本节的研究范围中)。具体分析框架如图2-23所示。

图2-23 整体分析框架

2.6.1 Gamma-Gamma模型

本节在对客户消费金额进行分析时将采用更为合理的Gamma-Gamma模型进行分析。在下面的章节中,将主要从消费金额模型的假设、似然函数的构建以及模型结果输出这三个方面对Gamma-Gamma模型进行描述。

1.模型假设

在构建本文的消费金额模型时,本文主要基于以下三个假设。

(1)一名客户每次的消费金额围绕他的消费金额均值随机波动;

(2)不同客户的消费金额均值存在差异,但同一名客户的消费金额均值不随时间发生变化;

(3)一名客户消费金额的变化与其消费过程无关。

对于一名客户,若他在观察期间内发生了x次交易行为,令z1z2,…,zx表示每次消费金额,那么该名客户所观察到的消费金额均值为(参见蔡瑞的论文“半契约情景中客户终生建模”):

其中,是对消费者潜在真实消费金额均值ζ的估计。本文建立消费金额模型的最终目的即为利用观察到的来推断潜在的ζ,表示为

基于此,首先利用x次消费金额值推导出的分布函数。关于zi服从何种分布,以前的研究者通常选择正态分布或者伽玛分布。在本研究中,最终采用伽玛分布来进行研究,原因主要有以下两点:①zi服从正态分布时的取值可以小于0,这与实际的情况不符;②正态分布是对称分布,而实际的zi分布则明显右偏。

综上所述,基于上文的三项假设,以及对zi分布的假设,本文所建立的消费金额模型假设如下。

(1)一名客户的消费金额均值服从伽玛分布:

(2)不同客户的消费金额均值异质性服从伽玛分布:

由于两项假设均使用了伽玛分布,所以该客户消费金额模型通常被称作Gamma-Gamma模型。

接下来,分别对式(2-50)和式(2-51)进行进一步解释。假设1是根据zi服从伽玛分布推导而来的,当一名消费者每次的消费金额服从伽玛分布时,公式为

根据伽玛分布的卷积性质,x次交易行为的消费金额总额服从gamma(pxv)。再根据伽玛分布的标度性,就服从gamma(pxvx)。

而针对假设2,由于参数v是gamma(pv)中的尺度参数,因此通过令其服从另一个伽玛分布,可实现刻画不同客户异质性的效果。

2.构建似然函数

基于前文的两项具体假设,利用x次消费金额值推导出任意一名消费者的分布函数为

对于每一名消费者(i=1,…,I),其在观察期内的购买次数xi和消费金额均值,可将其样本的对数似然函数构建为

最后,将通过最大似然函数法求得pqγ三个参数的值。

3.主要输出结果

1)群体层面的消费金额

反映群体层面消费金额的输出结果为任意消费者的潜在消费金额均值分布函数,即在不知道一名消费者具体购买次数xi和消费金额均值的情况下,仅利用三个估计参数(pqγ)刻画任意一名消费者的消费金额均值分布特征,表达式为fζ|pqγ)。

由于zi服从gamma(pv)分布,因此期望值为EZ i|pv)=ζp/v。但是由于消费者间异质ζ性的存在,且v又服从gamma(qγ)分布,所以任一个消费者的消费金额均值都是围绕ζ波动的随机变量Z,这就需要通过一个概率分布来进行描述。

基于此,本文采用变量替换法推导出该分布,由于ζhv),且:

所以,

该式为逆伽玛分布函数。其中,q为形状参数,为尺度参数。同时,该分布的均值和方差分别为

2)个体层面的购买行为

反映个体层面消费金额的输出结果为历史购买行为的个体消费者的消费金额均值的期望值,表示为。该值是在fζ|pqγ)基础上,引入一位消费者具体的历史购买行为信息,从而得到他特有的ζ分布,进而得到ζ的期望值。

根据一位消费者在观察期内的购买次数x和消费金额均值,从而推测其潜在的消费金额均值ζ,可表示为。根据贝叶斯理论:

从式(2-59)可以看出,v的后验分布仍然为伽玛分布,形状参数为pxq,尺度参数为,因此Z的期望均值为

式(2-60)为Z的条件期望。从拆分的表达式可以看出,它是由群体的消费金额均值期望值EZ)和观察到的个体消费金额均值所组成的加权平均值。当观察到的用于计算的个体购买次数x越多,那么公式中赋予EZ)的权重就越少,而赋予的权重就越多,反之亦然。

2.6.2 实证研究

1.数据提取

本节建模所需数据同样来源于大众点评网,将前6个月(2011年1月1日至2011年6月30日)作为建模期(即使用该区间内的客户交易数据进行模型参数估计),将后三个月(2011年7月1日起)作为验证期(即将估计出的参数代入模型计算输出结果并与该区间内的实际值进行对比)。具体的建模过程如图2-24所示。

在此需要注意的两点是:①输入数据都是具有重复购买次数(x>0)的消费者的历史消费数据,否则,输入数据为(0,0),这将成为样本的噪声点影响模型效果;②消费者消费金额模型包含一项重要的假设:一名消费者的消费金额均值不随时间发生变化,所以模型的两项输出结果没有包含时间变量,也不随时间发生变化。因此,本模型中的输出结果可以同时与建模期中以及验证期中的实际值分别进行比较,前者说明模型对历史数据的拟合效果,后者说明对未来消费特征的预测效果。

图2-24 消费者消费金额建模过程

2.结果分析

在本节中,将以作为判断拟合和预测效果的标准,将Gamma-Gamma模型与实际值进行对比。首先,本文先对具有重复购买次数的消费者消费金额数据进行描述性统计,具体如表2-38所示。通过表2-38可以看到,个体消费者的消费金额均值分布明显右偏,符合预期。

通过最大似然函数法,得到了Gamma-Gamma模型中所涉及的三个参数值以及最大对数似然函数值,具体结果如表2-39所示。

表2-38 个体消费者的消费金额均值描述性统计

表2-39 参数估计结果与最大对数似然函数值

图2-25显示的是样本客户消费金额均值的实际分布与模型计算分布的对比图。直观地评判,模型对实际值进行了很好的拟合。但是由于模型的分布函数是连续函数,无法再使用RSS评估拟合效果,因而这里仅从两个分布的均值来比较它们之间的差异,虽然方法较为粗糙,但是仍能在一定程度上反映拟合效果。在均值方面,模型计算出的均值期望为146.58元,比实际均值略低出9.84元,再一次说明模型取得了很好的拟合效果。

图2-25 客户消费金额均值分布(实际值vs.模型)

图2-26显示的是在建模期内具有不同重复购买次数消费者的消费金额均值,可以看出,Gamma-Gamma模型达到了很好的拟合效果。由于这里只有一个模型与实际值进行比对,所以使用RSS来衡量没有参照性,这里选择直接使用表格将各值列出,并计算不同重复购买次数下模型高估或者低估的百分比,如表2-40所示。从表中可以看出,误差最大的是当重复购买次数为1的情况,模型低估了17.72%,但这仍然属于较为理想的误差范围以内。

图2-26 建模期内不同重复购买次数的消费者消费金额均值

表2-40 建模期内不同重复购买次数的消费者消费金额均值

图2-27显示的是在验证期内具有不同重复购买次数的客户的消费金额均值,可以看出,相比于在建模期内的表现,Gamma-Gamma模型在验证期中的预测效果稍差,系统性地高估了消费金额均值。表2-41列出了各重复购买次数下的实际值与模型值,以及模型高估的百分比。从表中可以看出,误差最大的是当重复购买次数为1的情况,模型高估了54.84%,但是随着重复购买次数的增大,模型高估的误差也有缩小的趋势。从整体上看,模型的预测值还是能较好地反映不同重复购买次数间客户消费金额均值的变化趋势,所以预测效果仍然可以接受,当然也存在一定的提升空间。

图2-27 验证期内不同重复购买次数的客户消费金额均值

表2-41 验证期内不同重复购买次数的客户消费金额均值