文章目录
前言
为了后续更好的学习hive数仓,这里先附上Hive安装部署的教程。后续文章会详细讲解hive的原理和使用。安装Hive的前置条件是:
1.安装好对应版本的hadoop集群,并启动hadoop的HDFS以及YARN服务;
2.安装了MysqL服务,并启动MysqL的服务
1. root用户下安装MysqL
2. 安装MysqL
2.1 下载并安装MysqL官方的yum源
安装到第三个节点node03上
[hadoop@node03 ~]$ su root
- 进入/kkb/soft目录,并安装wget软件
[root@node03 hadoop]# cd /kkb/soft/
[root@node03 soft]# yum -y install wget
出现Installed!字样,表示成功安装
- 使用wget命令下载MysqL的rpm包
[root@node03 soft]# wget -i -c http://dev.MysqL.com/get/MysqL57-community-release-el7-10.noarch.rpm
-i 指定输入文件
-c 表示断点续传
2.2 安装MysqL
[root@node03 soft]# yum -y install MysqL57-community-release-el7-10.noarch.rpm
- 安装MysqL server这步可能会花些时间,需要在线下载,视网速而定;然后再安装;安装完成后就会覆盖掉之前的mariadb
[root@node03 soft]# yum -y install MysqL-community-server
3. 设置MysqL
3.1 MysqL服务
- 首先启动MysqL服务
[root@node03 soft]# systemctl start MysqLd.service
- 查看MysqL启动状态
[root@node03 soft]# systemctl status MysqLd.service
下图active(running)表示MysqL服务已启动
3.2 修改密码
[root@node03 hadoop]# grep "password" /var/log/MysqLd.log
- 可以查看到我的临时密码为
注意:不同人的临时密码不一样,根据自己的实际情况而定
fHy3Su:&REkh
[root@node03 hadoop]# MysqL -uroot -p
set global validate_password_policy=LOW;
关键字“Query OK”表示,sql语句执行成功
- 设置密码最小长度
set global validate_password_length=6;
ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';
- 开启MysqL的远程连接权限
grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;
flush privileges;
exit
2. Hive的安装部署
注意hive就是一个构建数据仓库的工具,只需要在一台服务器上安装就可以了,不需要在多台服务器上安装。
此处以安装到node03为例;
使用hadoop普通用户操作
1.1 先决条件
- 搭建好三节点Hadoop集群;
- node03上先安装好MysqL服务;
1.2 准备安装包
-
下载hive的安装包,可以访问官网下载:
- http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.14.2.tar.gz
我这里准备好了安装包供下载,或者也可以关注我的公众号回复hive获取安装包
mysql-connector的jar包 链接:
https://pan.baidu.com/s/1PDyYDXX-PIohe-m7pk4GLA 密码: hftp
hive安装包
链接: https://pan.baidu.com/s/1GI3mLcvobzGQbOcwruwFzA 密码: jign
-
规划安装目录
- /kkb/install
-
上传安装包到node03服务器中的/kkb/soft路径下
1.3 解压
- 解压安装包到指定的规划目录/kkb/install
[hadoop@node03 ~]$ cd /kkb/soft/
[hadoop@node03 soft]$ tar -xzvf hive-1.1.0-cdh5.14.2.tar.gz -C /kkb/install/
1.4 修改配置文件
[hadoop@node03 soft]$ cd /kkb/install/hive-1.1.0-cdh5.14.2/conf/
- 重命名hive-env.sh.template
[hadoop@node03 conf]$ mv hive-env.sh.template hive-env.sh
- 修改hive-env.sh
[hadoop@node03 conf]$ vim hive-env.sh
#配置HADOOP_HOME路径
export HADOOP_HOME=/kkb/install/hadoop-2.6.0-cdh5.14.2/
#配置HIVE_CONF_DIR路径
export HIVE_CONF_DIR=/kkb/install/hive-1.1.0-cdh5.14.2/conf
[hadoop@node03 conf]$ vim hive-site.xml
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:MysqL://node03:3306/hive?createDatabaseIfNotExist=true&characterEncoding=latin1&useSSL=false</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.MysqL.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>
<property>
<name>hive.cli.print.header</name>
<value>true</value>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>node03</value>
</property>
</configuration>
- 创建hive日志存储目录
[hadoop@node03 conf]$ mkdir -p /kkb/install/hive-1.1.0-cdh5.14.2/logs/
[hadoop@node03 conf]$ pwd
/kkb/install/hive-1.1.0-cdh5.14.2/conf
[hadoop@node03 conf]$ mv hive-log4j.properties.template hive-log4j.properties
[hadoop@node03 conf]$ vim hive-log4j.properties # 修改文件
#更改以下内容,设置我们的hive的日志文件存放的路径,便于排查问题
hive.log.dir=/kkb/install/hive-1.1.0-cdh5.14.2/logs/
1.5 拷贝MysqL驱动包
-
上传MysqL驱动包,如
mysql-connector-java-5.1.38.jar
到/kkb/soft
目录中
[hadoop@node03 ~]$ cd /kkb/soft/
[hadoop@node03 soft]$ cp mysql-connector-java-5.1.38.jar /kkb/install/hive-1.1.0-cdh5.14.2/lib/
1.6 配置Hive环境变量
- 切换到root用户下
[hadoop@node03 soft]$ su root
Password:
- 打开
/etc/profile
文件
[root@node03 soft]# vim /etc/profile
export HIVE_HOME=/kkb/install/hive-1.1.0-cdh5.14.2
export PATH=$PATH:$HIVE_HOME/bin
- 切换回hadoop用户,并source
[root@node03 soft]# su hadoop
[hadoop@node03 soft]$ source /etc/profile
1.7 验证安装
- hadoop集群已启动
- MysqL服务已启动
- 在node03上任意目录启动hive cli命令行客户端
[hadoop@node03 ~]$ hive
- 查看有哪些数据库
show databases;
- 说明hive安装成功
- 退出cli
quit;
总结
至此,数仓工具hive已安装完成,接下来就可以愉快的学习hive的相关知识了。获取更多干货,请关注我的个人公众号,关注领取福利
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。