你好,游客 登录
背景:
阅读新闻

Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

[日期:2014-04-15] 来源:dongxicheng.org   作者:佚名 [字体: ]

  注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

  1.    权限相关配置参数

  这里的权限由三部分组成,分别是:(1)管理员和普通用户如何区分 (2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序,(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。

  管理员列表由参数yarn.admin.acl指定。

  服务级别的权限是通过配置hadoop-policy.xml实现的,这个与Hadoop 1.0类似

  队列级别的权限是由对应的资源调度器内部配置的,比如Fair Scheduler或者Capacity Scheduler等,具体阅读后面几节。

  2.    日志聚集相关配置参数

  日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负 载,且提供一个中央化存储和分析机制。默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配 置。

  (1) yarn.log-aggregation-enable

  参数解释:是否启用日志聚集功能。

  默认值:false

  (2) yarn.log-aggregation.retain-seconds

  参数解释:在HDFS上聚集的日志最多保存多长时间。

  默认值:-1

  (3) yarn.log-aggregation.retain-check-interval-seconds

  参数解释:多长时间检查一次日志,并将满足条件的删除,如果是0或者负数,则为上一个值的1/10。

  默认值:-1

  (4) yarn.nodemanager.remote-app-log-dir

  参数解释:当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)。

  默认值:/tmp/logs

  (5) yarn.log-aggregation.retain-seconds

  参数解释:远程日志目录子目录名称(启用日志聚集功能时有效)。

  默认值:日志将被转移到目录

  ${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款