您的位置:首页 > 其它

Hive 数据倾斜总结

2014-04-12 16:51 549 查看
【Hive 数据倾斜总结】
做hive语句优化经常会听到一个名词"数据倾斜",究竟什么是数据倾斜,这里有篇文章解释的挺到位.其实数据倾斜的原因就那么几种,可以通过group by 取top逐一排查,多动手,多折腾,多比较.如何解决?小表在左,大表在右;表若不大,map join;关注空值,避免倾斜;来自@数据挖掘_PHP





From:http://weibo.com/1784501333/AFiNWBQSQ?type=repost

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: