1.Sqoop作用
Sqoop是一个用于在Hadoop和关系数据库服务器之间传输数据的工具。它用于从关系数据库(如MysqL,Oracle)导入数据到Hadoop HDFS,并从Hadoop文件系统导出到关系数据库。
2.安装教程
下载安装包
下载地址:http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.6-cdh5.14.2.tar.gz
解压到opt目录下
tar -zxf sqoop-1.4.6-cdh5.14.2.tar.gz
改名并移到指定opt目录下的新建子目录soft下
mv sqoop-1.4.6-cdh5.14.2 soft/sqoop146
导MysqL驱动包mysql-connector-java-5.1.38到sqoop146的lib文件夹下
官网下载MysqL驱动包:
mv mysql-connector-java-5.1.38-bin.jar /opt/soft/sqoop146/lib
另一种方法:
到IDEA本地仓库去找到MysqL驱动包拖到lib文件夹下
导hadoop驱动包到sqoop的lib文件夹
主要有3个 :
hadoop-common-2.6.0-cdh5.14.2.jar
hadoop-hdfs-2.6.0-cdh5.14.2.jar
hadoop-mapreduce-client-core-2.6.0-cdh5.14.2.jar
cp /opt/soft/hadoop260/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.2.jar /opt/soft/sqoop146/lib
cp /opt/soft/hadoop260/share/hadoop/hdfs/hadoop-hdfs-2.6.0-cdh5.14.2.jar /opt/soft/sqoop146/lib
cp /opt/soft/hadoop260/share/hadoop/mapreduce2/hadoop-mapreduce-client-core-2.6.0-cdh5.14.2.jar /opt/soft/sqoop146/lib
如下图所示:
到sqoop的conf文件下更改配置
cd soft/sqoop146/conf/
改文件名并修改配置
cp sqoop-env-template.sh sqoop-env.sh
//hadoop目录
export HADOOP_COMMON_HOME=/opt/soft/hadoop260
//hadoop目录
export HADOOP_MAPRED_HOME=/opt/soft/hadoop260
//hive环境变量目录
export HIVE_HOME=/opt/soft/hive110
//zookeeper配置文件目录
export ZOOCFGDIR=/opt/soft/zk345/conf
//hbase环境变量目录
export HBASE_HOME=/opt/soft/hbase120
配置sqoop环境变量
vi /etc/profile
//sqoop目录
export SQOOP_HOME=/opt/soft/sqoop146
export PATH=$PATH:$SQOOP_HOME/bin
激活配置
source /etc/profile
验证是否安装成功
以下命令用于验证Sqoop版本。
如图所示出现版本信息,sqoop已经安装成功!
列出MysqL中所有数据库
sqoop list-databases --username root --password root --connect jdbc:MysqL://localhost:3306/
sqoop list-tables --username root --password ok --connect jdbc:MysqL://localhost:3306/数据库名
下篇文章中小编会整理出如何使用sqoop从RDB到HDFS的数据迁移、到Hive的数据迁移、到Hbase的数据迁移,以及Hadoop的HDFS中的数据导进到RDB,和一些导数据中遇到的常见报错和解决方案
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。