您的位置:首页 > 大数据 > Hadoop

Hadoop运行时一直卡在Running job解决:

2020-07-15 06:14 1031 查看

Hadoop运行时一直卡在Running job解决:

在mapred-site.xml下将

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

改成

<property>
<name>mapreduce.job.tracker</name>
<value>hdfs://192.168.1.120:8001</value>
<final>true</final>
</property>

ip是master地址。

这个方案能够解决问题,这说明问题就出在yarn的配置上面,但是这样的话map服务并没有在yarn上面跑,然后又看到一篇文章说是要设置yarn里面关于内存和虚拟内存的配置项,在yarn-site.xml添加如下配置:

<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>20480</value>
</property>
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>2048</value>
</property>
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>2.1</value>
</property>

根据作者的分析是因为分配的内存和CPU资源太少,不能满足Hadoop和Hive运行所需的默认资源需求。但是我尝试了这个方案发现并不能解决我的问题。但是第二天发生了特别玄幻的事,我把mapred-site.xml下的又改回去

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

想着实验一下yarn的一些配置。。。但是这一次却行了???试了几次都可以在yarn上运行。。。

Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而mapreduce等运算程序则相当于运行于操作系统之上的应用程序,yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序,Yarn就成为一个通用的资源调度平台。

参考链接:
未运行在yarn上

修改yarn配置

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐