你好,游客 登录 注册 搜索
背景:
阅读新闻

Hadoop yarn配置参数

[日期:2016-01-20] 来源:博客园精华区  作者: [字体: ]

  参照site: http://hadoop.apache.org/docs/r2.6.0/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

  我们在配置yarn的时候只有充分了解各参数的含义,才能避免隐患。这些参数均在yarn-site.xml中配置

  以下涉及的简写:

  RM:ResourceManager

  AM:ApplicationMaster

  NM:NodeManager

参数 默认值 描述
yarn.resourcemanager.hostname   RM的hostname
yarn.resourcemanager.address ${yarn.resourcemanager.hostname}:8032 RM对客户端暴露的地址,客户端通过该地址向RM提交应用程序等
yarn.resourcemanager.scheduler.address ${yarn.resourcemanager.hostname}:8030 RM对AM暴露的地址,AM通过地址想RM申请资源,释放资源等
yarn.resourcemanager.webapp.address ${yarn.resourcemanager.hostname}:8088 RM对外暴露的web  http地址,用户可通过该地址在浏览器中查看集群信息
yarn.resourcemanager.webapp.https.address ${yarn.resourcemanager.hostname}:8090 web https 地址
yarn.resourcemanager.resource-tracker.address ${yarn.resourcemanager.hostname}:8031 RM对NM暴露地址,NM通过该地址向RM汇报心跳,领取任务等
yarn.resourcemanager.resource-tracker.client.thread-count 50 处理来自NM的RPC请求的handler数
yarn.resourcemanager.admin.address ${yarn.resourcemanager.hostname}:8033 管理员可以通过该地址向RM发送管理命令等
yarn.resourcemanager.scheduler.class

org.apache.hadoop.yarn.server.resourcemanager

.scheduler.capacity.CapacityScheduler

资源调度器主类
yarn.resourcemanager.scheduler.client.thread-count 50 处理来自AM的RPC请求的handler数
yarn.scheduler.minimum-allocation-mb 1024 可申请的最少内存资源,以MB为单位
yarn.scheduler.maximum-allocation-mb 8192 可申请的最大内存资源,以MB为单位
yarn.scheduler.minimum-allocation-vcores 1 可申请的最小虚拟CPU个数
yarn.scheduler.maximum-allocation-vcores 32 可申请的最 大虚拟CPU个数
yarn.nodemanager.local-dirs ${hadoop.tmp.dir}/nm-local-dir 中间结果存放位置,可配置多目录
yarn.log-aggregation-enable false 是否启用日志聚合
yarn.nodemanager.remote-app-log-dir /tmp/logs 日志聚合目录
yarn.nodemanager.resource.memory-mb 8192 NM总的可用物理内存,以MB为单位。一旦设置,不可动态修改
yarn.nodemanager.resource.cpu-vcores 8 可分配的CPU个数
yarn.nodemanager.aux-services   NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序

  Hadoop历史服务器jobhistoryserver的配置

  参照site http://hadoop.apache.org/docs/r2.6.0/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

  jobhistoryserver的默认值我们可以在mapred-site.xml文件中进行修改

  下面列举几个常用参数

参数 默认值 描述
mapreduce.jobhistory.address 0.0.0.0:10020 JobHistory服务器IPC 主机:端口
mapreduce.jobhistory.webapp.address 0.0.0.0:19888 obHistory服务器Web UI地址,用户可根据该地址查看Hadoop历史作业情况
mapreduce.jobhistory.done-dir ${yarn.app.mapreduce.am.staging-dir}/history/done 在什么目录下存放已经运行完的Hadoop作业记录
mapreduce.jobhistory.intermediate-done-dir ${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate 正在运行的Hadoop作业记录

  (1)、历史作业记录是存放在HDFS目录中;

  (2)、由于历史作业记录可能非常多,所以历史作业记录是按照年/月/日的形式分别存放在相应的目录中,这样便于管理和查找;

  (3)、对于每一个Hadoop历史作业记录相关信息都用两个文件存放,后缀名分别为*.jhist,*.xml。

  *.jhist文件里存放的是具体Hadoop作业的详细信息

  *.xml文件里面记录的是相应作业运行时候的完整参数配置

  (4)、每一个作业的历史记录都存放在一个单独的文件中

  原文链接:http://www.cnblogs.com/yinchengzhe/p/5142659.html?utm_source=tuicool&utm_medium=referral





收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款