P02_Hadoop CDH 5.3.6集群搭建

时间:2022-05-07
本文章向大家介绍P02_Hadoop CDH 5.3.6集群搭建,主要内容包括安装hadoop包、修改core-site.xml、修改hdfs-site.xml、修改mapred-site.xml、修改yarn-site.xml、修改slaves文件、在另外两台机器上搭建hadoop、启动hdfs集群、启动yarn集群、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。

安装hadoop包

1、下载hadoop-2.6.0-cdh5.12.0.tar.gz,上传到虚拟机的/usr/local目录下。[CDH下载地址](http://archive.cloudera.com/cdh5/cdh/5/) 2、将hadoop包进行解压缩:tar -zxvf hadoop-2.6.0-cdh5.12.0.tar.gz 3、对hadoop目录进行重命名:mv hadoop-2.6.0-cdh5.12.0.tar.gz hadoop 4、配置hadoop相关环境变量

vi /etc/profile

export HADOOP_HOME=/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

5、创建/usr/local/data目录

修改core-site.xml

<property>
  <name>fs.default.name</name>
  <value>hdfs://sparkproject1:9000</value>
</property>

修改hdfs-site.xml

<property>
  <name>dfs.name.dir</name>
  <value>/usr/local/data/namenode</value>
</property>
<property>
  <name>dfs.data.dir</name>
  <value>/usr/local/data/datanode</value>
</property>
<property>
  <name>dfs.tmp.dir</name>
  <value>/usr/local/data/tmp</value>
</property>
<property>
  <name>dfs.replication</name>
  <value>2</value>
</property>

修改mapred-site.xml

<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>

修改yarn-site.xml

<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>sparkproject1</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>

修改slaves文件

sparkproject2
sparkproject3

在另外两台机器上搭建hadoop

1、使用如上配置在另外两台机器上搭建hadoop,可以使用scp命令将sparkproject1上面的hadoop安装包和/etc/profile配置文件都拷贝过去。(scp -r hadoop root@sparkproject2:/usr/local) 2、要记得对/etc/profile文件进行source,以让它生效。 3、记得在sparkproject2和sparkproject3的/usr/local目录下创建data目录。

启动hdfs集群

1、格式化namenode:在sparkproject1上执行以下命令,hdfs namenode -format 2、启动hdfs集群:start-dfs.sh3、验证启动是否成功:jps、50070端口 sparkproject1:namenode、secondarynamenode sparkproject2:datanode sparkproject3:datanode 4、hdfs dfs -put hello.txt /hello.txt

启动yarn集群

1、启动yarn集群:start-yarn.sh2、验证启动是否成功:jps、8088端口 sparkproject1:resourcemanager、nodemanager sparkproject2:nodemanager sparkproject3:nodemanager