您的位置:首页 > 其它

科研实习生 数据挖掘在陶瓷行业客户关系管理中的应用

2007-11-30 10:59 405 查看
 

1.数据挖掘的概念

各种研究机构由于观点和背景的不同,对数据挖掘都有不同的定义。可以从技术角度进行定义,也可以从商业角度进行定义。

1).技术上的定义

数据挖掘(DataMninig)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

2).商业角度的定义

数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。

简而言之,数据挖掘其实是一类深层次的数据分析方法。数据分析本身己经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学研究,另外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为了分析的目的而收集的,而是由于纯机会的(opportunistic)商业运作而产生。分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。

因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。

2.数据挖掘的几种常用算法

   由于数据挖掘所涉及的学科领域和方法很多,因此对数据挖掘的采用的技术也有很多种,下面对数据挖掘常采用的技术做一简单介绍:

1)        关联规则算法

这里介绍的关联规则算法是apriori算法。APriori算法在第一次迭代时,由I直接构成候选1一项目集的集合C,,若 I={i1,i2,i3…..im},则C1={{i1},{i2},{i3},…..,{im}},然后根据最小支持率确定频繁1一项目集的集合L1。APriori算法在第k次迭代中,先根据上一次迭代过程中找到的频繁项目集的集合Lk-1,产生本次迭代的候选项目集的集合ck;然后为Ck中的每个项目集分配一个初始为零的计数器ocunt,保存其最小支持度。依次扫描数据集D中的事务,确定包含在每条事务中且属于ck的项目集,增加这些项目集的计数器值,在所有事务都扫描完之后即可得到ck中各项目集的支持数,根据|D|剑和最小支持率计算各项目集的支持率就可确定ck中频繁项目集。重复上述过程直到没有新的项目产生为止。

2)        决策树

       决策树算法是目前应用最广泛的归纳推理算法之一,是一种逼近离散值函数的方法,也可将它看作是一个布尔函数。它是以实例为基础的归纳学习算法,通过对一组训练数据的学习,构造出决策树形式的只是表示,在决策树的内节点进行属性值的比较并根据不同的属性值判断从该节点向下的分枝,从而在决策树叶节点得到结论。所以从根到叶节点的一条路径就对应着一条规则,整棵决策树就对应着一组吸取表达式规则。在决策树分类算法中,最有影响力的是Q uinlan 提出的ID 3 算法。ID 3 分类算法描述ID 3 算法的概述如下:

       算法:Generate_decision_tree 由给定的训练数据产生一颗判定树。

输入:训练样本T,由离散值属性表示;候选属性的集合

attribut_list。

输出:一颗判定树(决策树)。

3)        聚类算法:根据“物以类聚,人以群分”的朴素思想,从中发现的一定的规律和典型的模式。聚类分析主要研究基于几何距离的聚类,在使用上,首先要定义多维空间和距离,以距离作为相似性的判别标准。分类不同的是,聚类操作中要划分的类是事先未知的,类的形成完全是数据驱动的,属于一种无指导的学习方法。聚类分析的方法较多,例如系统聚类法、基于划分法、基于模型法,动态聚类法、模糊聚类法等.采用不同的聚类方法,对于相同的记录集合可能有不同的聚类结果。

4)        神经网络算法

     神经网络:根据一种叫做“似脑机器”的思想,提出的一种基于生物神经元特性的互连模型,通常,神经网络由输入、中间层和输出三个层次构成。每一个神经元在接受了各种输入后,再计算总输入值,由过滤机制比较总输入,然后确定它的输出值。神经网络有以下几个特点:l)具有自学习功能,对于预测等具有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其前途是很远大的。2)具有联想存储功能,人工神经网络的反馈网络可以实现这种联想功能。3)具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解。从神经网络思想的提出到现在大约己经有30多种模型被开发和应用,表2一l是神经网络模型的比较。

由于人工神经网络模型较多,因此在进行数据挖掘时,必须根据数据挖掘的目的,选择合适的神经网络模型和算法,才能获得较好的数据挖掘效果。

5)        遗传算法

    遗传算法是在20世纪60年代末由J.H.Holland提出并建立的,是根据生物进化思想而启发得出的一种全局优化算法,在本质上是一种求解问题的并行全局搜索方法,不依赖具体的问题,它能够在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最优解。在求解不确定性、非线性问题、复杂系统工程领域的有效的优化方法,近年来在国内外得到了广泛的应用。GA是模拟自然中的进化过程或演变过程的算法模型,它比传统搜索方法具有更强的鲁棒性,全局搜索能力较强而局部搜索能力弱,但是传统的遗传算法往往存在两个严重的缺点:一个是要达到真正的最优解需要花费很长的时间;另一个是易发生“早熟”现象。

6)        归纳规则

   关联规则是指大量数据中项集之间有趣的关联或相关联系。关联规则发现最初的形式是零售商的货篮分析,即通过发现顾客放入其货篮中的不同商品,来分析顾客的购买习惯,进而得到商品之间的关联,从而帮助零售商制订营销策略。在关联规则中,一般用支持度、可信度、期望可信度和作用度来描述关联规则的属性, Apriori算法是最基本的关联规则发现算法。

三.陶瓷行业客户关系管理系统中数据挖掘模型的建立

1.改进的决策树在陶瓷企业客户获取中的应用

客户的获取即是使潜在的客户转换为企业的正式客户。传统的获取客户的方法如开展大规模的联合广告活动,或根据所了解的目标客户群的情况进行直销活动等。尽管有丰富经验的市场人员可以选择出相关的人口调查属性的筛选条件,但是当数据量增大时,这也会变得相当困难。当客户数量不断增长和每位客户的细节因素增多时,要得出这样的行为模式的复杂度也同样增大。随着客户数据库的规模迅速膨胀,用手工对潜在客户群的市场细分几乎是不可能的。应用数据挖掘技术可以帮助企业完成对潜在客户的筛选工作,并与CRM系统中的销售自动化结合,把由数据挖掘技术得出的客户名单与这些客户可能感兴趣的优惠措施系统地结合起来,获得更高的投资回报率。

陶瓷企业的发展和壮大需要不断获得新客户、维持老客户。数据挖掘技术可以用来揭示客户的行为习惯和预测发现一些在不同情况下有相似行为的新客户,帮助建陶企业识别出这些潜在的客户群, 并提高市场活动的响应率,使客户关系管理做到心中有数、有的放矢。数据挖掘技术还可以帮助市场营销人员完成对潜在客户的发现和筛选工作# 把潜在的客户名单和这些客户感兴趣的营销,促销措施系统地结合起来#为每一个客户提供个性化、一站式的服务,以不断地获取新客户。

决策树算法的基本原理是使用信息论方法对大量实例的特征进行信息量分析,计算各特征的互信息,找出反应类别的重要特征,该算法是一种非常有效的算法。决策树算法主要优点有:可以生成可以理解的规则;计算量相对来说不是很大,可以处理连续和分散的字段;可以清晰地显示哪些字段比较重要。基于决策树算法如上优点,该文采用基于该算法的改进算法构建获取客户的预测模型。获取客户模型具体流程如图所示。

1.1 C4.5决策树算法原理

该算法在训练数据集的基础上构造决策树。每个实例对应属性集和类集的一组具体的值。每个属性有很多连续或者离散值。并且用unknow这个特殊的值代表缺失值。预测类只允许是离散的,用C1,C2...Cnclass代表类。决策树是一种由树枝节点和叶子构成的树状数据结构。每个叶子表示一个预测类,一个节点表示基于一个属性的分裂。实例用决策树进行分类,根据其属性值将实例归入某个类,即根据实例的属性值在决策树上形成一个从根结点到叶子节点的路径。该叶子节点表示的类就是实例被决策树预测的类。’&$#算法通过分裂和控制策略来构造决策树。在C4.5算法中,树中的每个节点对应着一组实例。并且,实例被赋予一定的权值weight,从而将缺失属性值考虑在内。在根结点所有实例的权重赋为1。其算法执行过程如程序如下:

C4.5构造树算法form tree伪代码:

1.2 决策树算法采用的度量标准

决策树算法采用信息增益率进行属性的选取和节点的分裂。如果a是离散属性,对于该属性有h个不同的已知属性值,则相应的将T分成T­1 ,T2 ...Th ,这h个子集,每个子集中的属性a的属性值分别为a1 a2 ...ah ,则信息增益为:

 

2.数据挖掘在陶瓷企业交叉销售中的应用

现在企业和客户之间的关系是经常变动的,一旦一个人或者一个公司成为客户,就要尽力使这种客户关系趋于完美。一般来说可以通过这三种方法:

1.最长时间的保持这种关系

2.最多次数的和你的客户交易

3.最大数量的保证每次交易的利润

公司和其客户之间的商业关系是一种持续不断的发展的关系,其间伴随着双方商业合作范围的扩展与收缩。如何更好的加强这种双向的合作,在可能的条件下与客户开展尽可能多的商业合作从而实现更大的商业利润是交叉营销所要达到的目的。向现有客户提供新的产品和服务的营销过程谓之为交叉营销。企业需要对现有客户进行交叉营销(Cross-seliing)。交叉营销就是指向现有的客户提供新的产品和服务的营销过程。它的目标就是达到双赢的结果,即客户和商家都可以从中获益。客户获益是得到更好更贴切的服务质量,商家则是因为增加了销售量而获利。使用数据挖掘技术进行交叉营销的分析是从分析现有客户的购买行为数据开始,首先得到关于现有客户消费习惯的数据。在寻找交叉营销机会前决定希望提供给客户哪些种类的产品和服务。然后收集数据,包括客户的个人信息(如年龄、收入、婚姻状况、住址等)和交易记录(如最近的收支情况、消费次数、消费类别等),另外还包括与分析相关的一些外部数据。

准备好所需的数据后,接着选择数据挖掘的算法进行建模,对每一种交叉营销的情况都建立一个模型,且对每种交叉营销的情况进行分析的过程都是独立的厂用来分析新的客户数据以预测出这些客户将来的行为。

经过对客户进行各种交叉营销模型的分析,得出客户在各种交叉营销方案中的评分,即可能接受这些交叉营销的程度。根据最终得到的评分矩阵(行表示客户,列表示客户在各种交叉营销方案下依模型计算的得分),确定给予特定的客户哪种交叉销售产品或服务,从而提高客户的价值。

交叉营销是建立在双赢的基础之上的,客户因得到更好更多的符合其需求的服务而获益在实际的商业操作中可以有很多方法来优化这种关系。例如一个建筑陶瓷生产商A和一个装潢公司B建立了合作关系。那么就增加了向对方现有客户提供自己的产品和服务的机会。而他们的利润都有增加,即因为A的经济保证使得B有更多的潜在客户和己有客户更有条件享受B的服务,而A也在此过程中实现了更多的盈利。使用数据挖掘技术的关联规则模式可以帮助企业找出客户最适合的服务种类,来进行针对性的营销活动。

关联规则算法在建筑陶瓷行业中的交叉销售应用,主要采用了Apriori 算法

算法描述如下:

输入:事物数据库D;最小支持度闻值mnisPuport。

输出:D中的频繁项集L。

Apriori算法第一步是找出所有频繁1-项目集;第2一10步由APriori_gen函数根据Lk-1,产生Ck,然后扫描数据集中的每条事务计算Lk;AProiri_gen函数和哈希数据结构的使用是使APriori算法具有较高的挖掘效率的关键技术。

3.数据挖掘在陶瓷企业客户细分中的应用

近几年,国内一对一营销(oneToone)正在被越来越多的企业和媒体宣传。一对一营销是指了解客户,并和客户建立起长期的、持续的关系。这个看似很新的概念却通常采用一些传统的过程和方法来完成,如焦点小组、电话调查等,甚至有一些公司理解的一对一营销就是每逢客户生日或纪念日给他寄一张卡片。这些方法基本上是着眼于人口统计学的数据。但如果一个大型企业,拥有的客户数量很大,由于各种限制,与每一个客户分别进行交流不现实,一个可行的方法就是客户细分。针对不同的分析需求,可以对客户按照自然属性(年龄、职业、区域、职称、文化程度等)和行为属性(呼叫行为、消费行为等)进行群体划分,以便市场经营与决策人员针对不同的用户群采用不同的市场策略。客户细分的主要目标是:发现不同客户群体的特征。分析在某一目标下,按贡献度划分的客户群体分布。

客户细分的原理是将客户的属性采用分类分析技术分为若干类,对具有某一类行为特征的用户,分析其基本信息,找出客户属性与客户基本特征之间的潜在关系。分类将一组客户按照相似性划归成若干类别,使得属于同一类别的客户之间的距离尽可能小,而不同类别客户之间的距离尽可能大。对客户进行分类后,统计分析各个类别的行为特性,按照各个行为类别贡献度的大小对各个类别进行排序。客户细分特性按不同的目标有不同的客户群体分布,如消费行为在贡献度不同的客户群体中的分布百分比,呼叫行为的分布情况等等。

在CRM系统中,可以通过数据挖掘技术来进行客户细分,把大量的客户分成不同的类,每个类里的客户有相似的属性,而不同的类里的属性则不同。企业只需对属于同一类中的客户采取相同的个性化服务,即可大大降低企业的成本。

在客户细分中,经过神经网络算法,聚类,决策树等算法的比较后选择聚类算法来处理在建陶行业中的客户细分比较恰当。

具体算法如下:

假定样本数据点i=1,2,3,4,5,聚类结果找到k个聚类{C1,C2,C3,……,Ck},

For  i=1,……,k令 ri为从D中随机选取的一个点,作为聚类初始中心点;

While (在聚类q中有变化发生,聚类中心位置改变)do

    形成聚类:

      For  i=1,……,k  do

        

其中d(ri,x)为点x到聚类Ci中心点气的距离,d(rj,x)为点x到聚类Cj中心点rj的距离;

End;

计算新的聚类中心点:

For  i=1,……,k  do

新的聚类中心为聚类Ci内点的均值向量,其中ni是第i个聚类中的点数;

      End;

End;

4.神经网络在陶瓷企业客户价值中的应用

根据客户生命周期价值公式,本文将客户资源价值挖掘工作具体表述为:在客户的生命周期内,通过数据挖掘技术,捕捉客户的购买需求和预测其价格承受能力,适时提供合适的产品或服务,满足客户的每个潜在需求,同时尽力延长客户的生命周期。实现客户资源价值最大化。挖掘流程如图1所示。其中,知识库里预存的挖掘所需要的知识,是本文研究的重点所在,这些知识将用于指导数据挖掘的操作过程以及用于帮助对挖掘结果的评估;挖掘引擎是一组挖掘功能的集成模块,它根据应用主题,在知识库的指导下,对数据仓库中的数据进行分析,提炼出相关的模式。

                   客户资源价值挖掘流程图

4.1 BP神经网络结构

神经网络是由大量的被称作神经元的节点相互联结,模拟人的大脑神经处理信息的方式,进行信息并行处理和非线形转换的复杂网络系统。神经网络处理信息是通过信息样本对神经网络的训练,使其具有类似于人的大脑的记忆、辨识能力,完成各种信息处理功能。神经网络具有良好的自学习、自适应、联想记忆、并行处理和非线形转换的能力,避免了复杂数学推导,在样本缺损和参数漂移的情况下,仍能保证稳定的输出。在各种神经网络模型中,BP神经网络是应用最为广泛的一种神经网络模型之一,它已在许多实际中,如模式识别系统辩识图像处理函数拟合等领域得到了广泛而成功的应用。因其简单可行,效率较其他神经网络算法更高的特点,使BP神经网络算法成为在CRM中应用神经网络算法的首选。   通常把神经网络看成一种冲输入到输出的映射,假定有n个输入节点和m个输出节点,那么,神经网络实现的是从n维欧式空间到m维的高度非线性映射,且理论上对n和m没有大小限制。BP神经网络属于典型的前向网络,典型的BP神经网络是由输入层、输出层和一个隐含层组成的三层网络,这也是最常用的一种BP神经网络,相邻两层的神经元之间形成全互连接,同层各神经元互不连接。在使用BP算法时,首先要确定BP神经网络的最佳结构。

4.2 BP学习算法

反向传播(Back Propagation)算法也称BP算法,相应的神经网络也称为BP网络。BP学习算法是一种多级非循环网络使用的有导师学习算法。其学习算法的步骤是:

4.2.1前向传播阶段

(1)根据实际问题,设计网络结构和样本集,从样本集中取出一个样本(Xp,Yp),将Xp输入网络;

(2)计算相应的实际输入Op

在此阶段,网络将输入经过变换,传到输出层,此过程中,输入被执行下面的运算:Op=Fn(...(F2(F1(XpW(1))W(2))...)W(n))

4.2.2后向传播阶段

(3)计算实际输出Op与理想输出Y

(4)按照极小化误差的原则调整权值

这个阶段并不是无限进行下去,一般是根据实际情况,设置需要的精度来控制,取

作为网络对第p个样本的误差,将网络对整个样本集的误差则定义

4.2.3返回前向阶段,重复(1)步, 重新选择样本值,直到误差值满足精度要求。根据下面公式调整权值:

在这里,又分为两种情况:

(1)若j是输出节点,则

(2)若j是隐含层节点,则

虽然典型的BP算法有样本顺序对输出结果的影响,但鉴于CRM中的样本,即客户资料的抽取有的随机性,所以,这里顺序的影响可以忽略。算法的实现

四、客户关系管理的总体设计

1、CRM系统的结构

1)数据挖掘平台的结构图

图中最底层是算法层,它负责实现具体数据挖掘算法,如关联规则,决策树等算法;其上是模型层,这些模型是客户关系管理的分析模型,它们通过调用算法层的具体算法来实现各种分析功能,如客户流失分析;最上层是应用层,该层直接和模型层进行交互,避免和具体复杂算法相接触,从而降低了开发的复杂性。这种层次模型的优点是具有良好的柔性与开放性,当需求发生改变从而导致算法或分析模型需要更改时,可方便地在相应的层次进行变更而不会影响到具体的应用。

2)CRM的总体结构图

CRM系统结构由三个部分组成:数据支撑部分、业务数据处理部分和数据

分析部分,其结构图如图

                       CRM的总体结构图

(1)数据支撑部分:该部分由业务数据库、其它数据源和数据仓库组成,业务数据库里面主要存放了日常业务操作数据,如客户数据、订单数据和销售数据等;其它数据源在图中表示为“其它数据库”和“其它数据文件”,它们并不存储系统所涉及的业务数据,可能来自于企业的其它系统和一些文件如Excel文件等。在e一CRM的开发中暂不会用到其它数据源,但有可能随着日后用户需求的增长而将它们包含进来;数据仓库主要根据分析主题,从业务数据库和其它数据源有组织有目的地转入数据,从而满足分析和数据挖掘的需要。

(2)数据分析部分:该部分负责对数据仓库的数据进行分析处理,包括建立多维数据集,实现联机分析处理功能以辅助企业决策,建立并训练数据挖掘模型,寻找数据中有趣的模式,实现客户分类预测。

(3)业务数据处理部分:该部分负责处理系统中一些日常业务,包括客户关怀,客户服务反馈,制定/管理市场任务等。由该部分所产生的数据将会进入到数据仓库中,为以后的挖掘工作提供数据支持。

2、CRM的数据库设计

数据仓库和数据挖掘是客户关系管理中最为常见的信息使用技术,其中,数

据仓库提供给用户用于决策支持的当前和历史的数据,而这些数据在传统的操作

型数据库中是比较难以得到的。通过构建数据仓库,可以使数据高度集成,将那

些属于不同单位,彼此之间没有联系的数据库系统,建立数据立方体,使他们成为一个有机的整体,通过上卷、下钻、切片、切块等操作,能够在不同层次、不同角度纵览数据、分析数据,而且为数据挖掘提供了大量可靠的、高质量的数据源泉,形成了数据挖掘赖以存在的数据基础。而数据仓库技术的高低影响着数据质量的好坏和数据的完整程度,从而也影响到数据挖掘所构建模型的有效性。而且通过构建数据仓库,可以将大量的闲置数据分析利用,挖掘这些数据内在的价值,为企业的长期发展,提供决策依据;可以达到高度的可扩展性,数据仓库的设计带有全局性,具有高度的可扩展性,它能解决的问题包括目前发生的和将来有可能发生的问题。总而言之,数据仓库和数据挖掘共同构成了客户关系管理的主要技术基础,使得客户关系管理对顾客价值和关系价值的识别更为科学和有效。

a)        数据仓库的建立

  通过对Oracle、SQL Server数据仓库综合进行比较,最终选定采用SQL Server2ooo中的 AnalysisManager作为构建数据仓库的工具。对简单的数据钻取、切片可以非常方便的通过Excel中数据透视表功能实现,可以为数据分析提供了具体保证。

1.      数据源表数据结构设计

        表1事实表数据结构

字段名

类型

宽度

顾客ID

整型

16

商品ID

整型

l0

时间ID

整型

l0

销售ID

整型

l0

促销ID

整型

l0

地区ID

整型

l0

表2地区表数据结构

字段名

类型

宽度

地区ID

整型

20

销售地区

文本

100

表3顾客信息表数据结构

字段名

类型

宽度

顾客ID

整型

16

卡号

整型

50

姓名

文本

20

地址

文本

50

邮编

整型

20

性别

布尔型

2

年龄

整型

4

月收入

整型

10

受教育程度

文本

100

开户日期

日期

 

职业

文本

20

电话号码

数字

 

电子邮件

备注

 

表4时间表数据结构

字段名

类型

宽度

陶瓷产品ID

整型

10

编号

整型

10

名称

文本

50

商标

文本

20

类别

文本

20

商品类别描述

备注

 

商品重量

数字

 

表5时间表数据结构

字段名

类型

宽度

时间ID

整型

10

日期/时间

 

日期/时间

 

日期/时间

 

表6促销表数据结构

字段名

类型

宽度

促销ID

整型

10

促销地区

文本

100

促销商标名称

文本

50

促销商品类型

备注

 

促销商品开始日期

日期/时间

 

促销商品截止日期

日期/时间

 

2.事实表和维表设计

维度

级别

成员属性

数据类型

地区维

地区ID

地区ID

整型

地区名称

文本

时间维

 

 

 

 

 

 

 

 

 

顾客维

 

 

 

 

 

 

 

顾客ID

顾客ID

整型

卡号

整型

姓名

文本

地址

文本

邮编

整型

性别

布尔型

年龄

整型

月收入

整型

受教育情况

文本

开户日期

日期

职业

文本

电话号码

数字

邮箱

备注

 

 

陶瓷商品维

 

 

商品ID

编号

整型

名称

文本

商标

文本

类别

文本

商品类别描述

备注

 

 

      促销维

 

 

促销ID

促销ID

整型

促销地区

文本

促销商品名称

文本

促销商品类型

备注

促销商品开始日期

日期/时间

促销商品截止日期

时间/日期

 

3、CRM的详细设计

1)模块功能描述

客户关系管理模块:该模块对客户的基本情况进行管理,包括了四个子模块:客户档案管理模块、合作伙伴管理模块、客户关怀管理模块和客户服务管理模块。其中客户档案管理模块用于实现客户基本情况的录入、修改、删除、查询等操作,客户基本信息包括客户的姓名、性别、年龄、居住地等,这些信息将为数据挖掘模块提供基本数据的支持;合作伙伴管理模块用于对企业的合作伙伴进行管理,通过该模块,能够全面准确地了解合作伙伴的状态、合作伙伴关心的产品和他们的交易习惯等,从客户价值的方面来说,合作伙伴是企业的一种重点客户;客户关怀管理模块用于对客户和合作伙伴的历史交易进行分析,找出很久没有进行交易或联系的客户,从而使企业适时的对他们进行“特别关照”,以掌握他们的购买意向;客户服务管理模块主要对企业售后服务进行管理,通过该模块,企业可以制定服务计划,并了解客户对产品的反馈、客户投诉建议等一系列情况,这些情况也可用于数据挖掘。

数据挖掘模块:该模块对以上三大模块所提供的客户、合作伙伴、市场、销售、服务、价格等信息进行数据挖掘、统计和分析,为企业发展提供决策依据。本模块包括客户价值分析、交叉销售分析、客户流失分析以及扩展挖掘功能接口。其中客户价值分析主要应用客户价值分析模型对客户价值进行分析;交叉销售分析主要运用交叉销售分析模型对企业为交叉销售提供支持;客户流失分析主要运用客户流失分析模型对客户的流失原因进行分析;此外,e一CRM还提供了扩展挖掘功能接口。使用该接口,将可以对e一CRM的挖掘功能进行扩展,以便根据业务需求,随时调整并扩充系统的功能。

2)功能结构图

     

CRM

客户管理模块

数据挖掘模块

客户档案管理

合作伙伴管理

客户关怀管理

客户服务管理

客户获取管理

较差销售管理

客户细分管理

价值分析管理

                          图  CRM的系统功能图

五、客户关系管理系统的实现(由于时间关系,此部分暂且不实现)

六、         结论与展望

(1)本文工作总结

客户关系管理(Customer Relationship Management,CRM)是帮助企业了解客户和把握市场的重要工具,而数据挖掘则可以从大量客户数据中挖掘出隐含的、对企业决策有帮助的知识和规则,故将数据挖掘应用到CRM系统中将会为企业呈现更多有价值的数据。在客户数据挖掘方面,目前的数据挖掘工具如SPSS公司的Clemnentie软件等,由于价格等因素,不太适合中小企业使用,针对这个问题,结合重庆某中小企业为实际背景,本文将数据挖掘技术融入到客户关系管理系统的开发中去,开发了CRM客户关系管理系统,对论文总结如下:

1、研究了客户关系管理系统的结构、组成以及数据挖掘和数据仓库技术在其中的应用。

2、提出了一种基于k—maens聚类算法和ID3决策树算法的客户价值分析方法,并进行了实现。

3、结合ID3算法和AProiri算法分别实现了客户流失分析功能和交叉销售分析功能,以支持企业决策。

4、给出并介绍了CRM系统的功能、架构以及相应的数据库和数据仓库结构,并结合MssQLsevrerZ000的数据转换服务o( DataTransofrmation sevrices,DTs)工具实现了数据的抽取和转换。

CRM系统以数据仓库和数据挖掘技术为支撑,具备操作型CRM系统的基本功能,同时实现了客户价值分析,客户流失分析,交叉销售分析等一些分析型CRM系统的功能,是一种介于操作型和分析型CRM系统之间的系统,是对中小型企业CRM软件开发的一次尝试。和大型数据挖掘软件相比,本文所实现的数据挖掘过程操作简单,且挖掘结果在界面呈现上比较直观,对企业的决策能起到辅助作用。

(2)本文进一步的工作

由于时间,条件和本人水平的局限,本论文还存在一些不足和需要深入研究的方面,数据挖掘技术在CMR很多方面都有很好的应用,本文只是在其中某几个方面做了相应的探讨研究,其它许多方面都还具有非常高的研究价值和意义。例如在客户满意度分析方面,客户信用度方面,及客户流失预测等方面都需要更多深入地进行研究,使数月据挖掘技术在CMR中能够得到更好地应用。

总之,在客户关系管理中使用数据挖掘技术的应用研究是国内外目前研究的热点,同时也存在着许多难点,总体上还处于一个初步的研究阶段,还有许多工作需要人们不断得去深入研究和探索。

 

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: