您的位置:首页 > 大数据 > 云计算

云计算项目实战之系统API模块

2013-12-18 11:12 295 查看
第一部分: 需求分析



用户上网区域分布及变化-user_online_info_area(Hive)
字段名
地区
用户数

日期

字段类型
String

bigint

String

1. 根据开始时间结束时间来查询用户的变化情况

2. 如2012 02 02 ,2012
02 03,那么代表查这样日期之间的用户数

用户上网流量统计-user_online_traffic(Hive)
字段名
用户ID
总流量

日期

字段类型
String

double

String

1. 根据开始时间结束时间来查询流量的汇总情况

2. 如2012 02 02 ,2012
02 03那么代表查这样日期之间的流量的汇总

热门网站统计-hot_url (Hive)
字段名
url
pv

日期

字段类型
String

bigint

String

1. 根据开始时间结束时间来查询URL的排序情况

2. 如2012 02 02 ,2012
02 03那么代表查这样日期之间的URL的排序

Ip地址流量统计-user_traffic_by_ip (Hive)
字段名
流量
ip

日期

字段类型
double

bigint

String

1.根据开始时间结束时间来查询IP的流量汇总情况

2. 如2012 02 02 ,2012
02 03那么代表查这样日期之间的IP的流量汇总

根据IP或者URL导出用户包

根据输入的IP或者URL来导出用户的ID包

第二部分: 技术点

Hive各类SQL的使用

第三部分: 代码实现



私塾在线原创独家云计算课程
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: