Hadoop | 核心配置三-完全分布式搭建基本完成

Hadoop | 核心配置

配置 core-site.xml

cd $HADOOP_HOME/etc/hado
vim core-site.xml

  <?xml version="1.0" encoding="UTF-8"?>
  <?xml-stylesheet type="text/xsl" href="configuration.xsl"?

  <configuration>
    <!-- 指定 NameNode 的地址 -->
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop102:8020</value>
    </property>
    <!-- 指定 hadoop 数据的存储目录 -->
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/opt/module/hadoop-3.1.3/data</value>
    </property>

    <!-- 配置 HDFS 网页登录使用的静态用户为 zhy-->
    <property>
      <name>hadoop.http.staticuser.user</name>
      <value>zhy</value>
    </property>
  </configuration>

HDFS 配置文件 (hdfs-site.xml)

vim hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?

<configuration>
  <!-- nn web 端访问地址-->
  <property>
    <name>dfs.namenode.http-address</name>
    <value>hadoop102:9870</value>
  </property>
  <!-- 2nn web 端访问地址-->
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop104:9868</value>
  </property>
</configuration>

YARN配置文件(yarn-site.xml)

vim yarn-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
  <!-- 指定 MR 走 shuffle -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <!-- 指定 ResourceManager 的地址-->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop103</value>
  </property>
  <!-- 环境变量的继承 -->
  <property>
    <name>yarn.nodemanager.env-whitelist</name>
    <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLAsspATH_PREPEND_disTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
  </property>
</configuration>

MapReduce配置文件(mapred-site.xml)

vim mapred-site.xml

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?

<configuration>
<!-- 指定 MapReduce 程序运行在 Yarn 上 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

分发配置

xsync /opt/module/hadoop-3.1.3/etc/hadoop

检查分发情况

登录其他机器检查

启动集群

配置workers
vim /opt/module/hadoop- 3.1.3/etc/hadoop/workers
增加以下内容:

hadoop102
hadoop103
hadoop104

同步所有节点该配置文件
xsync /opt/module/hadoop-3.1.3/etc
如果集群是第一次启动，需要在 hadoop102 节点格式化 NameNode（注意：格式化 NameNode，会产生新的集群 id，导致 NameNode 和 Datanode 的集群 id 不一致，集群找不到已往数据。如果集群在运行过程中报错，需要重新格式化 NameNode 的话，一定要先停止 namenode 和 datanode 进程，并且要删除所有机器的 data 和 logs 目录，然后再进行格式化。）
hdfs namenode -format
sbin/start-dfs.sh
在配置了 ResourceManager的节点（hadoop103）启动YARN sbin/start-yarn.sh
Web端查看端查看 HDFS的 NameNode
1. 访问：http://hadoop102:9870
2. 查看 HDFS 上存储的数据
Web 端查看 YARN 的 ResourceManager
1. 浏览器中输入：http://hadoop103:8088
2. 查看 YARN上运行的 Job信息

Hadoop | 核心配置三-完全分布式搭建基本完成

Hadoop | 核心配置

配置 core-site.xml

HDFS 配置文件 (hdfs-site.xml)

YARN配置文件(yarn-site.xml)

MapReduce配置文件(mapred-site.xml)

分发配置

检查分发情况

启动集群

相关推荐