你好,游客 登录
背景:
阅读新闻

Ubuntu下配置Hadoop环境

[日期:2015-01-29] 来源:IT165收集   作者: [字体: ]

实现真正的分布式的hadoop,并不是伪分布式的。

一、系统与配置

共准备2台机器搭建Hadoop集群。基于Ubuntu14.04,jdk1.6.0_45,Hadoop1.0.3版本,虚拟机使用VMware10.0

192.168.1.10  NameNode  master (master)

192.168.1.20  DateNode   slave1(Slave) 

我的用户名就hadoop

接下来需要安装一些常用的软件:vim,ssh

view sourceprint?
1.sudo apt-get update
2.sudo apt-get install vim
3.sudo apt-get install ssh
首先修改本机IP

然后输入以下命令,修改hosts

view sourceprint?
1.sudo vim /etc/hosts
\
接下来设置ssh,实现无密码登陆,输入以下命令,生成秘钥
view sourceprint?
1.ssh-keygen -t rsa -P ""

\

 一直按回车就会生成秘钥,然后 在.ssh目录中会生成id_rsa 和id_rsa.pub两个文件,这两个文件分别是SSH的私钥和公钥。

生成authorized_keys文件:cat id_rsa.pub >> authorized_keys实现无密码登陆本地localhost的ssh中,

二、安装hadoop和jdk

解压hadoop的压缩包,我的安装目录是/home/hadoop(这是用户名)/hadoop(这是文件夹)/

view sourceprint?
1.tar -zxvf hadoop1.0.3.ta

解压缩jdk的压缩包,命令类似上面,不过是将文件该名称,这里就不列出来了 然后下来是修改环境变量

view sourceprint?
1.sudo vim /etc/profile
2.export JAVA_HOME = /home/hadoop/hadoop/jdk1.6.0_45
3.export PATH = $JAVA_HOME/bin:$PATH
4.export HADOOP_HOME = /home/hadoop/hadoop/hadoop-1.0.3
5.export PATH = $JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
别忘了执行 source /etc/profile,让路径立马生效
最后配置hadoop下的conf文件夹中的文件 修改hadoop-env.sh \

修改core-site.xm\

修改hdfs-site.xml

\

修改mapred-site.xml

\

修改masters,和slaves文件,在masters中只写master也就是上面提到的192.168.1.0 ,slaves中填写master和slave。

然后格式化namenode,在hadoop-1.0.3文件中写入下面命令

view sourceprint?
1.bin/hadoop namenode -format
对了这里一直没有提到slave的配置,其实特别简单,关闭当前的虚拟机,复制一份刚才的虚拟机文件,然后重亲起名,再次打开,修改用户名和ip就好了,我的Ubuntu名字是一样,只要不在一个盘里就行。

 

\
最后在master(用户名,也就是主节点的ubuntu)中输入以下命令,同样也是在hadoop-1.0.3的文件中

view sourceprint?
1.bin/start-all.sh
然后输入JPS查看java进程,如果出现以下5个进程,就表示成功(不包括jps)

\
可以查看网页

\

已经有两个节点,到此整个hadoop分布式的部署就完成了。





收藏 推荐 打印 | 录入: | 阅读:
相关新闻       Hadoop环境 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款