微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hadoop_JAVA操作HDFS

之前已经在虚拟机上安装好了hadoop,下面纪录下用java操作hdfs和中间遇到的一些问题,使用的是伪分布式模式

一 本地配置hadoop环境变量

此处认已经具备jdk环境.
将hadoop的压缩包解压到任意目录

在环境变量中配置HADOOP_HOME变量,值为hadoop所在的目录

二、编写测试类

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.junit.Before;
import org.junit.Test;

import java.net.URI;


public class JavaToHDFS {
    // 定义类变量文件系统,用来链接hdfs
    FileSystem fs = null;

    //预处理,链接hdfs
    @Before
    public void init() throws Exception {
        fs = FileSystem.get(new URI("hdfs://192.168.10.102:9000"), new Configuration(), "root");
    }

    @Test
    public void mkdir() {
        System.out.println(fs);
    }
}

测试会发现会报一个这样的错误

这是因为在本地运行hadoop程序需要依赖一些依赖库和工具类,需要工具的可以直接搜索你对应Hadoop版本的winutils.exe

下载完后吧他bin里面的文件全部拷贝到Hadoop的bin文件

添加完后就可以正常运行了

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐