您的位置：首页 > 其它

spark on hive 总结

2015-07-31 11:26 204 查看

1、大表之间的关联需要自己指定task的任务数,

spark.sql.shuffle.partitions

2、很多task生产太多的小文件

3、hive表中有很多文件，起和文件数一样的任务数

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部