数据挖掘是从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。关联规则挖掘是数据挖掘中重要的研究方法之一。它主要用于发现大量数据中间有趣的关联或相关联系。关联规则挖掘的一个典型例子是产品销售分析:研究发现产品销售中不同商品之间的联系,找出顾客购买行为模式。
分析目标和分析思路
通过对历史保险产品销售情况分析,可以发现两个方面的规律性:
一是,客户的特征与他们购买产品之间的规律性。
探询客户不同特征,例如:性别、年龄、婚姻状况、职业等方面,对其购买产品的影响。最终发现具有哪些特征的客户倾向于购买哪些产品。这不论是对一次销售还是二次销售,都具有很好的指导意义。
二是,哪些产品之间具有组合销售的可能性,如何开拓客户的二次购买行为。
因为在目前保险产品销售中,促成客户的首次购买,换句话说也就是开拓一个新的客户,它所付出的成本是比较高的。保持一个老客户,并使他们继续购买更多的保障,相对成本比较低。但是在对老客户进行二次销售的时候,不能盲目进行。如果能够根据产品间的关联性,有针对性地销售,将能够大大提高销售的成功率。
此外,在使用关联规则分析保险产品销售的时候,我们必须意识到保险产品的一些特点:保险产品有效期限一般较长,因此购买行为的频率相对较低。同时,保险公司的产品不断推陈出新,老的产品不断停售,新的产品在原来的基础上略加改动就可取代老的产品,即便在同一时期销售的产品,也有不少是属于同一类的产品。因此,笔者将在相对较长的时间内进行分析,同时,将针对保险产品类型进行分析,而不是针对具体产品进行分析。
基于以上考虑,初步划定的产品类型包括:两全保险、终身保障、终身寿险、终身重疾、定期寿险、定期重疾、教育年金、养老金、医疗、意外伤害、住院补贴、投资型等。对于客户特征,主要关注:性别、年龄、婚姻状况、职业。
数据准备
本实例分析数据来自某保险公司某地区2005年销售情况,出于商业和客户隐私保密的考虑,不展示真实数据。
经过数据的收集、整理、转换等准备工作,笔者得到以下形式的可用于分析的中间数据:
(1)数据范围:2005年销售的保单,即投保日期在2005年;同时选取购买了两种或两种以上类别的保险产品的被保人。(因为仅购买了一种产品无法进行关联分析)
(2)数据说明:婚姻:0:未婚,1:已婚;性别:0:男,1:女;职业类别:1~6,共6类职业,1类风险最小,6类风险最高;年龄档:以2005年12月31日为基准,根据出生日期计算年龄,然后再按下面规则分档:1:[0,18], 2:[19,35], 3:[36,50], 4:[51,70], 5:[71,);保险类别:T:已购买此类产品,F:未购买此类产品。
数据的准备工作可能是个非常复杂、工作量巨大的工作,特别是当涉及到的数据范围和数量都比较多的时候。对于企业比较全面的数据挖掘分析,可能还必须借助数据仓库来作为数据挖掘分析的数据源。因此,数据的准备工作往往要依靠IT技术部门来实现。
挖掘关联规则
将上述中间数据,读入数据挖掘软件Clementine,针对两种不同的关联分析,进行不同的设置后,运行软件进行分析。由于篇幅所限,在此不再详细说明挖掘过程。
结果分析
下面就是针对产品类进行的关联规则挖掘,得出的关联规则:
通过对上面关联规则的分析,我们注意关注第11、12、13、14号规则。发现以下规律:
投资型产品在所有产品中销售情况最好,67.23%的客户购买了投资型产品(第12、14号规则中投资型产品的Support%最高);其次是定期寿险和定期重疾。
定期寿险和投资型产品的组合,在所有产品组合中销售情况最好。有29.71%的客户购买了这一组合(第13、14号规则中,投资型与定期寿险组合的Rule Support%最高),其次是投资型与定期重疾组合。
购买了定期寿险的客户其中有55.43%购买了投资型产品,信任度最高(第13号规则的Confidence%),其次是购买定期重疾的客户购买投资型产品的规则(第11号)
那么这些规则对销售业务带来那些指导意义呢?笔者认为大致可以有以下几点:
继续大力推动投资型产品的销售;
定期寿险/定期重疾与投资型产品的关联规则表示出:客户在购买多份保险时,既会关注保险产品的保障功能,也会关注其投资价值。一个理性的客户,会使自己在保障和投资两个方面达到平衡。因此,针对已有投资型产品的客户,可以大力推荐寿险和重疾类保障产品;对于已有寿险、重疾等保障类产品的客户,可以大力推荐其购买投资型产品。