微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hive安装部署

文章目录


前言

为了后续更好的学习hive数仓,这里先附上Hive安装部署的教程。后续文章会详细讲解hive的原理和使用。安装Hive的前置条件是:
1.安装好对应版本的hadoop集群,并启动hadoop的HDFS以及YARN服务;
2.安装了MysqL服务,并启动MysqL的服务


1. root用户下安装MysqL

  • CentOS 7中切换到root用户,安装MysqL
  • 在CentOS 7中认安装有MariaDB,这个是MysqL的分支;但还是要安装MysqL,而且安装完成之后会直接覆盖掉MariaDB

2. 安装MysqL

2.1 下载并安装MysqL官方的yum源

安装到第三个节点node03上

  • 使用root用户,在CentOS 7服务器的/kkb/soft路径下执行以下命令
  • 切换到root用户
[hadoop@node03 ~]$ su root
  • 进入/kkb/soft目录,并安装wget软件
[root@node03 hadoop]# cd /kkb/soft/
[root@node03 soft]# yum -y install wget

出现Installed!字样,表示成功安装

  • 使用wget命令下载MysqL的rpm包
[root@node03 soft]# wget -i -c http://dev.MysqL.com/get/MysqL57-community-release-el7-10.noarch.rpm

-i 指定输入文件

-c 表示断点续传

2.2 安装MysqL

[root@node03 soft]# yum -y install MysqL57-community-release-el7-10.noarch.rpm
  • 安装MysqL server这步可能会花些时间,需要在线下载,视网速而定;然后再安装;安装完成后就会覆盖掉之前的mariadb
[root@node03 soft]# yum -y install MysqL-community-server

3. 设置MysqL

3.1 MysqL服务

[root@node03 soft]# systemctl start MysqLd.service
[root@node03 soft]# systemctl status MysqLd.service

下图active(running)表示MysqL服务已启动

在这里插入图片描述

3.2 修改密码

[root@node03 hadoop]# grep "password" /var/log/MysqLd.log
  • 可以查看到我的临时密码

注意:不同人的临时密码不一样,根据自己的实际情况而定

fHy3Su:&REkh

在这里插入图片描述

[root@node03 hadoop]# MysqL -uroot -p
set global validate_password_policy=LOW;

关键字“Query OK”表示,sql语句执行成功

set global validate_password_length=6;

在这里插入图片描述

ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';
  • 开启MysqL的远程连接权限
grant all privileges  on  *.* to 'root'@'%' identified by '123456' with grant option;
flush privileges;
exit

2. Hive的安装部署

注意hive就是一个构建数据仓库的工具,只需要在一台服务器上安装就可以了,不需要在多台服务器上安装。

此处以安装到node03为例;

使用hadoop普通用户操作

1.1 先决条件

  • 搭建好三节点Hadoop集群;
  • node03上先安装好MysqL服务;

1.2 准备安装包

  • 下载hive的安装包,可以访问官网下载:

    • http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.14.2.tar.gz
我这里准备好了安装包供下载,或者也可以关注我的公众号回复hive获取安装包

mysql-connector的jar包 链接: 
https://pan.baidu.com/s/1PDyYDXX-PIohe-m7pk4GLA  密码: hftp
hive安装包 
链接: https://pan.baidu.com/s/1GI3mLcvobzGQbOcwruwFzA  密码: jign
  • 规划安装目录

    • /kkb/install
  • 上传安装包到node03服务器中的/kkb/soft路径下

1.3 解压

  • 解压安装包到指定的规划目录/kkb/install
[hadoop@node03 ~]$ cd /kkb/soft/
[hadoop@node03 soft]$ tar -xzvf hive-1.1.0-cdh5.14.2.tar.gz -C /kkb/install/

1.4 修改配置文件

[hadoop@node03 soft]$ cd /kkb/install/hive-1.1.0-cdh5.14.2/conf/
[hadoop@node03 conf]$ mv hive-env.sh.template hive-env.sh
[hadoop@node03 conf]$ vim hive-env.sh 
  • 如下,修改文件中HADOOP_HOME、HIVE_CONF_DIR的值(根据自己机器的实际情况配置)
#配置HADOOP_HOME路径
export HADOOP_HOME=/kkb/install/hadoop-2.6.0-cdh5.14.2/

#配置HIVE_CONF_DIR路径
export HIVE_CONF_DIR=/kkb/install/hive-1.1.0-cdh5.14.2/conf

在这里插入图片描述

修改配置文件hive-site.xml

  • conf目录下认没有此文件,vim创建即可
[hadoop@node03 conf]$ vim hive-site.xml
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:MysqL://node03:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=latin1&amp;useSSL=false</value>
        </property>

        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.MysqL.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>123456</value>
        </property>
        <property>
                <name>hive.cli.print.current.db</name>
                <value>true</value>
        </property>
        <property>
                <name>hive.cli.print.header</name>
            <value>true</value>
        </property>
    	<property>
                <name>hive.server2.thrift.bind.host</name>
                <value>node03</value>
        </property>
</configuration>

修改日志配置文件hive-log4j.properties

  • 创建hive日志存储目录
[hadoop@node03 conf]$ mkdir -p /kkb/install/hive-1.1.0-cdh5.14.2/logs/
[hadoop@node03 conf]$ pwd
/kkb/install/hive-1.1.0-cdh5.14.2/conf
[hadoop@node03 conf]$ mv hive-log4j.properties.template hive-log4j.properties
[hadoop@node03 conf]$ vim hive-log4j.properties # 修改文件
#更改以下内容,设置我们的hive的日志文件存放的路径,便于排查问题
hive.log.dir=/kkb/install/hive-1.1.0-cdh5.14.2/logs/

在这里插入图片描述

1.5 拷贝MysqL驱动包

[hadoop@node03 ~]$ cd /kkb/soft/
[hadoop@node03 soft]$ cp mysql-connector-java-5.1.38.jar /kkb/install/hive-1.1.0-cdh5.14.2/lib/

1.6 配置Hive环境变量

[hadoop@node03 soft]$ su root
Password:
[root@node03 soft]# vim /etc/profile
export HIVE_HOME=/kkb/install/hive-1.1.0-cdh5.14.2
export PATH=$PATH:$HIVE_HOME/bin
  • 切换回hadoop用户,并source
[root@node03 soft]# su hadoop
[hadoop@node03 soft]$ source /etc/profile

1.7 验证安装

  • hadoop集群已启动
  • MysqL服务已启动
  • 在node03上任意目录启动hive cli命令行客户端
[hadoop@node03 ~]$ hive
show databases;

在这里插入图片描述

  • 说明hive安装成功
  • 退出cli
quit;

总结

至此,数仓工具hive已安装完成,接下来就可以愉快的学习hive的相关知识了。获取更多干货,请关注我的个人公众号,关注领取福利

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐