您的位置:首页 > 大数据

spark大型项目实战:电商用户行为分析大数据平台(一)

2018-08-29 19:36 841 查看

标签:spark,大数据,电商,用户行为

项目介绍:

本项目主要用于互联网电商企业中,使用spark技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为,购物行为,广告点击行为等)进行复杂的分析。用统计分析出来的数据,辅助公司中的pm(产品经理),数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务,最终达到用大数据技术来帮助提升公司的业绩,营业额以及市场占有率的目标。

项目主要采用目前大数据领域最流行,最热门的技术--spark,具有普通项目无法比拟的技术前瞻性与尖端性,本项目使用了spark技术生态栈中最常用的三个技术框架,spark core,spark sql和spark streaming,进行离线计算和实时计算业务模块的开发,实现了包括用户访问session分析,页面单跳转化率统计,热门商品离线统计,广告流量实时统计4个业务模块

项目中所有的业务模块都是直接从实际企业项目中抽取出来的,业务复杂度绝对没有任何缩水,只是为了更好的贴近大数据实战课程的需要,进行了一定程度上的技术整合和业务整合。该项目的真实性,业务复杂性以及实战性都是一流的。

项目特色:

1:项目中采用完全还原企业大数据项目开发场景的方式来讲解,每一个业务模块的讲解都包括了需求分析,方案设计,数据设计,编码实现,功能测试,性能调优等环节

功能简介:

1:用户访问session分析:该模块主要是对用户访问session进行统计分析,包括session的聚合指标计算,按时间比例随机抽取session,获取每天点击,下单和购买排名前10的品类,并获取top10品类的点击量排名前10的session。该模块可以让产品经理,数据分析师以及企业管理层形象地看到各种条件下的具体用户行为以及统计指标,从而对公司的产品设计以及业务发展战略做出调整,主要使用spark core实现。

2:页面单跳转化率统计

3:热门商品离线统计

4:广告流量实时统计

环境介绍:

1:centos6.4        2:CDH5.3.6        3:Spark1.5.1          4:Zookeeper3.4.5          5:Kafka          

6:flume                  7:java(scala)      8:Eclipse

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐