【大数据部落】银行信用数据SOM神经网络聚类实现
2017-06-23 14:55
176 查看
在当今社会,“信用”越来越多的人们关注个人或企业,有望获得最高的信用评分,以享受更多的信贷额度,更优惠的利率。 那么我们如何评分信用,并使我们的客户可视化?
自组织地图(SOM)是一种无监督的数据可视化技术,可用于在较低(通常为2)维可视化高维数据集。
我们熟悉支付宝芝麻信用点,它是通过收购个人用户信息,经过处理,计算用户的信用评分,当然代表较高的信用评分越高。
当然,这些信息系统也记录下您所有的下落,即所谓的“数据”。这些数据的存储,清理和处理为客户的信用评级提供了一个健全丰富的信息来源。 基于此,银行分析和计算大数据技术,准确评估客户的信用。
银行客户信用评分数据从银行产生的内部数据或外部数据得出,如下图所示:
在本文中我们将从使用R:
对可视化银行客户的信用的人口属性进行som聚类并且进行可视化
通常,与信用等级相关的因素包含客户的学历、工资、年龄、额度使用情况、现金提取次数、还款时间等。
现在使用Kohonen方法训练SOM
som_grid <- somgrid(xdim = 10, ydim=10, topo="hexagonal")
查看训练过程的聚类距离
plot(som_model, type = "changes")
首先对聚类结果的效果进行可视化
不同聚类类别的节点数目
节点质量
近邻距离
从训练集中绘制性别变量的原始比例热图:
显示针对不同聚类大小的k均值的WCSS度量。
可以作为理想数量聚类的“粗略”指标
从结果中我们可以看到将数据划分成不同类别后得到的组间距离。
然后我们将数据划分成6个类别,然后查看数据的聚类情况
在网格上形成群集
为每个群集显示不同颜色的地图
通过对银行客户的信用评分的聚类,我们可以将客户划分成不同的类别,对银行的经营效益有着重要的作用,信用评分模型应用效果,很大程度上也取决于银行的内部管理及信贷政策。技术和管理相结合,双管齐下,一定是控制客户信用风险的最优方案。
大数据部落——中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务 :y0.cn/teradat(咨询服务请联系官网客服)
QQ:3025393450
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人
微信客服号:lico_9e
QQ交流群:186388004
自组织地图(SOM)是一种无监督的数据可视化技术,可用于在较低(通常为2)维可视化高维数据集。
我们熟悉支付宝芝麻信用点,它是通过收购个人用户信息,经过处理,计算用户的信用评分,当然代表较高的信用评分越高。
当然,这些信息系统也记录下您所有的下落,即所谓的“数据”。这些数据的存储,清理和处理为客户的信用评级提供了一个健全丰富的信息来源。 基于此,银行分析和计算大数据技术,准确评估客户的信用。
银行客户信用评分数据从银行产生的内部数据或外部数据得出,如下图所示:
在本文中我们将从使用R:
对可视化银行客户的信用的人口属性进行som聚类并且进行可视化
通常,与信用等级相关的因素包含客户的学历、工资、年龄、额度使用情况、现金提取次数、还款时间等。
现在使用Kohonen方法训练SOM
som_grid <- somgrid(xdim = 10, ydim=10, topo="hexagonal")
查看训练过程的聚类距离
plot(som_model, type = "changes")
首先对聚类结果的效果进行可视化
不同聚类类别的节点数目
节点质量
近邻距离
从训练集中绘制性别变量的原始比例热图:
显示针对不同聚类大小的k均值的WCSS度量。
可以作为理想数量聚类的“粗略”指标
从结果中我们可以看到将数据划分成不同类别后得到的组间距离。
然后我们将数据划分成6个类别,然后查看数据的聚类情况
在网格上形成群集
为每个群集显示不同颜色的地图
通过对银行客户的信用评分的聚类,我们可以将客户划分成不同的类别,对银行的经营效益有着重要的作用,信用评分模型应用效果,很大程度上也取决于银行的内部管理及信贷政策。技术和管理相结合,双管齐下,一定是控制客户信用风险的最优方案。
大数据部落——中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务 :y0.cn/teradat(咨询服务请联系官网客服)
QQ:3025393450
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人
微信客服号:lico_9e
QQ交流群:186388004
相关文章推荐
- matlab神经网络4:数据聚类-自组织映射
- Python神经网络代码识别手写字的实现流程(一):加载mnist数据
- SOM神经网络的数据分类--柴油机故障诊断
- 【大数据部落】spss modeler用决策树神经网络预测ST的股票
- [模式分类] 三维高斯分布数据训练三层神经网络实现分类
- web数据采集核心技术分享系列(四)利用神经网络实现网页验证码破解
- python分模块实现神经网络之CIFARF分类:1.加载CIFAR数据集中的数据
- 机器学习--感知器数据分类算法步骤(慕课网-实现简单的神经网络)
- 数据挖掘——线性神经网络的Matlab实现
- 基于.NET实现数据挖掘--神经网络算法原理
- 神经网络中embedding层作用——本质就是word2vec,数据降维,同时可以很方便计算同义词(各个word之间的距离),底层实现是2-gram(词频)+神经网络
- 数学建模_以fisheriris数据为例使用新版本神经网络工具箱feedforwardnet进行简单实现
- web数据采集核心技术分享系列(四)利用神经网络实现网页验证码破解
- Linux下网络攻击DDos的实现代码,tcp数据欺骗的实现
- 访问有用户名和密码的网络共享,实现数据导入
- 网络数据处理缓冲区和缓冲池实现
- 如何实现数据在网络中的通讯
- 作为神经网络存在的Twitter(数据篇)(ZT)
- [置顶] linux网络编程之:接受网络中的ARP数据并分析(附C语言实现)
- 新手入门:巧用Webbrowser实现网络数据采集