您的位置:首页 > 其它

hive中的concat,concat_ws,collect_set用法

2018-01-16 10:12 375 查看
需求:对用户的订单进行分析,将不同订单类型分别多少单展示出来,每个用户一行

原数据:

userorder_typeorder_number
user1delivered10
user2returned1
user1returned3
user2delivered20
目标:

userorder
user1delivered(10),returned(3)
user2delivered(20),returned(1)
1.使用concat()函数将order_type和order_number连接起来

concat(order_type,'(',order_number,')')

userorder
user1delivered(10)
user2returned(1)
user1returned(3)
user2delivered(20)
2.使用concat_ws()和collect_set()进行合并行
将上面列表中一个user可能会占用多行转换为每个user占一行的目标表格式,实际是“列转行”

select user,concat_ws(',',collect_set(concat(order_type,'(',order_number,')')))  order
from table group by user

order是别名

collect_set的作用:

(1)去重,对group by后面的user进行去重

(2)对group by以后属于同一user的形成一个集合,结合concat_ws对集合中元素使用,进行分隔形成字符串
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: