微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hadoop | 核心配置三-完全分布式搭建基本完成

Hadoop | 核心配置


配置 core-site.xml

  1. cd $HADOOP_HOME/etc/hado
  2. vim core-site.xml
  <?xml version="1.0" encoding="UTF-8"?>
  <?xml-stylesheet type="text/xsl" href="configuration.xsl"?

  <configuration>
    <!-- 指定 NameNode 的地址 -->
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop102:8020</value>
    </property>
    <!-- 指定 hadoop 数据的存储目录 -->
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/opt/module/hadoop-3.1.3/data</value>
    </property>

    <!-- 配置 HDFS 网页登录使用的静态用户为 zhy-->
    <property>
      <name>hadoop.http.staticuser.user</name>
      <value>zhy</value>
    </property>
  </configuration>

HDFS 配置文件 (hdfs-site.xml)

  1. vim hdfs-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?

<configuration>
  <!-- nn web 端访问地址-->
  <property>
    <name>dfs.namenode.http-address</name>
    <value>hadoop102:9870</value>
  </property>
  <!-- 2nn web 端访问地址-->
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop104:9868</value>
  </property>
</configuration>

YARN配置文件(yarn-site.xml)

  1. vim yarn-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
  <!-- 指定 MR 走 shuffle -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <!-- 指定 ResourceManager 的地址-->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop103</value>
  </property>
  <!-- 环境变量的继承 -->
  <property>
    <name>yarn.nodemanager.env-whitelist</name>
    <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLAsspATH_PREPEND_disTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
  </property>
</configuration>

MapReduce配置文件(mapred-site.xml)

  1. vim mapred-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?

<configuration>
<!-- 指定 MapReduce 程序运行在 Yarn 上 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

分发配置

xsync /opt/module/hadoop-3.1.3/etc/hadoop

检查分发情况

登录其他机器检查

启动集群

  1. 配置workers
    vim /opt/module/hadoop- 3.1.3/etc/hadoop/workers
    增加以下内容:
hadoop102
hadoop103
hadoop104
  1. 同步所有节点该配置文件
    xsync /opt/module/hadoop-3.1.3/etc
  2. 如果集群是第一次启动,需要在 hadoop102 节点格式化 NameNode(注意:格式化 NameNode,会产生新的集群 id,导致 NameNode 和 Datanode 的集群 id 不一致,集群找不到已往数据。如果集群在运行过程中报错,需要重新格式化 NameNode 的话,一定要先停止 namenode 和 datanode 进程,并且要删除所有机器的 data 和 logs 目录,然后再进行格式化。)
  3. hdfs namenode -format
  4. sbin/start-dfs.sh
  5. 在配置了 ResourceManager的节点 (hadoop103)启动YARN sbin/start-yarn.sh
  6. Web端查看 端查看 HDFS的 NameNode
    1. 访问:http://hadoop102:9870
    2. 查看 HDFS 上存储的数据
  7. Web 端查看 YARN 的 ResourceManager
    1. 浏览器中输入:http://hadoop103:8088
    2. 查看 YARN上运行的 Job信息

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐