手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
算法
设计模式
多媒体技术
正则表达式
Elasticsearch
Flink
Hadoop
IDE
UML
Promise
Gis
编程之家
Hadoop
Hadoop入门教程
1Hadoop入门教程Hadoop是Apache开源组织的一个分布式计算开源框架(http://hadoop.apache.org/),用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是:HDFS和MapReduce,HDFS实现存储,而MapReduce实现原理分析处理,这两部分是
作者:编程之家 时间:2022-09-05
获取yarn上APP的状态案例
获取yarn上APP的状态案例浪院长浪尖聊大数据在星球里和微信群里很多朋友都有疑惑,如何监控yarn上spark或者mr应用的存活状态,浪尖今天在这里分享一下实现方法,实际上只需要简单的几行代码即可。首先是,pom文件,添加yarn相关的配置<!--https://mvnrepository.com/artifact/
作者:编程之家 时间:2022-09-05
分布式计算(1):Ubuntu下搭建Hadoop-3.2.1详细步骤
所用配置Ubuntu-16.04-desktop-i386onVMware分布式集群方式(三台虚拟机:一台master,俩台slave)OpenJDKJava1.8.0Hadoop3.2.1本文主要讲解搭建基于Master的伪分布式集群(仅需1台虚拟机即可)目录所用配置SSH免密登陆设置JAVA1.8.0环境配置Hadoop安装及运行
作者:编程之家 时间:2022-09-05
HDFS简易知识理论
前言 :是Hadoop中用于数据存储的模块概述 1.是Hadoop中用于数据存储的模块 2.在存储数据的时候会将数据进行切块, 每一个块是一个Block,在Hadoop2.0是128M。 3.HDFS会对数据块进行自动备份,默认复本数量是3,但是在伪分布式 下复本数量必须设置为14.复本
作者:编程之家 时间:2022-09-05
hadoop3.1.3记录
官网文档https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html下载hadoop-3.1.3.tar.gzhttps://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gzhadoop组成yarn架构ResourceManager(由多个no
作者:编程之家 时间:2022-09-05
Hadoop 格式化format namenode 后,ambari端启动datanode节点无法正常启动处理
问题描述:hadoopnamenode-formathdfs重新格式化之后,重新启动后,一直无法启动。(有问题就查,不要一直格式化,干哈呢,万一脑裂了,咋弄,虽然有办法恢复)在datanode上的报错日志如下,可以看出id不一致2021-01-0916:34:09,920ERRORnamenode.NameNode(NameNode.java:main(1759))-F
作者:编程之家 时间:2022-09-05
头歌Educoder——大数据Hadoop开发环境搭建
文章目录第1关:配置开发环境-JavaJDK的配置任务描述相关知识下载JDK解压配置环境变量测试编程要求实现代码第2关:配置开发环境-Hadoop安装与伪分布式集群搭建任务描述相关知识下载Hadoop配置Hadoop环境设置SSH免密登录hadoop-env.sh配置yarn-env.sh配置core-site.
作者:编程之家 时间:2022-09-05
大数据之-Hadoop本地模式_WordCount官方案例---大数据之hadoop工作笔记0022
然后我们再来看一个hadoop,官方提供的一个案例,我运行起来看看效果.按照上面的过程我们来做一下上面是文档上的整个流程.首先我们还是创建,输入文件夹wcinput然后进入这个文件夹wcinput
作者:编程之家 时间:2022-09-05
WordCount的MapReduce程序
实验二:WordCount的MapReduce程序操作实践一、IDEA编写WordCount程序(1)环境pom.xml文件的配置(2)新建编写Map处理逻辑(3)编写Reduce处理逻辑(4)编写main方法(5)编译打包以及运行程序运行程序时采取以下步骤:首先需要将hadoop安装目录路径下的core-site.xml和hdfs-site.xml
作者:编程之家 时间:2022-09-05
Hadoop分布式/集群安装
Hadoop分布式/集群安装文章地址:小昭要好好学习~Hadoop分布式集群安装http://ghzzz.cn/2021/03/21/hadoop%e9%9b%86%e7%be%a4%e5%ae%89%e8%a3%85/完成!
作者:编程之家 时间:2022-09-05
Hadoop伪分布式集群安装部署
Hadoop伪分布式集群安装部署 浪尖 浪尖聊大数据 一、 准备环境1, 安装简介Java--jdk-8u121-linux-x64.tar.gzHadoop--hadoop-2.7.4.tar.gz(jdk1.7会报错)本系列教程所有jar包,请关注微信公众号 :Spark高级玩法,输入software获取。二, 修改主机名2.1查看主机名hostname2.2 修改
作者:编程之家 时间:2022-09-05
hadoop系列之MR经典案例分享二
hadoop系列之MR经典案例分享二 浪1234 浪尖聊大数据 4、MapReduce的join(hive已经实现)http://database.51cto.com/art/201410/454277.htm这三种join方式适用于不同的场景,其处理效率上的相差还是蛮大的,其中主要导致因素是网络传输。Mapjoin效率最高,其次是SemiJoin,最低的是reduce
作者:编程之家 时间:2022-09-05
Hadoop完全分布式的搭建
Hadoop完全分布式的搭建(桥接模式)注:所有节点需要处于同一局域网下,条件限制,我们可以开启手机热点一:配置好网络1.修改3个hadoop配置文件中的IPcd/usr/local/hadoop-2.7.3/etc/hadoop/vimcore-site.xmlvimhdfs-site.xmlvimyarn-site.xml2.更改网络设置中的IP,网关,DNS
作者:编程之家 时间:2022-09-05
Hadoop学习:MapReduce实现文件的解压缩
##✌✌✌古人有云,好记性不如烂笔头,千里之行,始于足下,每日千行代码必不可少,每日总结写一写,目标大厂,满怀希望便会所向披靡,哈哈哈!!!✌✌✌一、✌实现思想压缩>获取输入流>获取压缩相关信息(反射)>获取输出流>流的对拷>关闭资源解压缩>校验文件是否可以解压>获取
作者:编程之家 时间:2022-09-05
大数据之-Hadoop伪分布式_Log日志查看和NN格式化前强调---大数据之hadoop工作笔记0024
首先再复习一下hadoop的伪分布式的配置. 首先配置hadoop-env.sh,这里面主要配置好JAVA_HOME然后再去配置core-site.xml文件这个我们也设置好了.然后再去配置hdfs-site.xml,这个用来指定,hdfs,要存的副本的数量.这里有个问题,因为我们做的是伪分布式模式,我们用了一台电
作者:编程之家 时间:2022-09-05
大数据运维架构师培训1:Zookeeper,HadoopHDFS,MR,Yarn
一、风哥大数据运维架构师实战培训专题2.0介绍课程背景:为满足想学习和掌握大数据运维与体系架构的学员,风哥特别设计的一套比较系统的大数据库运维培训课程。 课程目标:本套风哥大数据运维架构师实战培训课程,分5个阶段:大数据Hadoop核心架构运维实战、大数据存储管理与查询分析实战、
作者:编程之家 时间:2022-09-05
一、使用两台Centos7系统搭建Hadoop-3.1.4完全分布式集群
上面这张思维导图喜欢就拿走,2021年,决定写大数据了。文章目录大数据常用技术词汇Hadoop集群Hadoop介绍集群搭建前的准备设置静态ip配置阿里云yum源安装JDK克隆一个虚拟机配置ssh免密码登录下载hadoop修改配置文件修改文件hadoop-env.sh修改文件workers修改文件core-sit
作者:编程之家 时间:2022-09-05
HDFS编程 — 用Java API 操作HDFS
使用Java操作HDFS,首先需要创建maven工程,创建maven工程的方法:https://www.cnblogs.com/ynqwer/p/14540108.html。在新建的maven工程的src/main/java/目录下就可以写Java程序操作HDFS,为了方便管理,可以在此目录下创建一个包,然后在包里面新建一个类,写代码操作HDFS。使用Java来操作HDF
作者:编程之家 时间:2022-09-05
linux升级openssl到1.1.1j 【2021-3-20】亲测可使
[root@hadoop~]#wgethttps://www.openssl.org/source/openssl-1.1.1j.tar.gz[root@hadoop~]#tar-zxvfopenssl-1.1.1j.tar.gz-Coot/[root@hadoop~]#cdoot/openssl-1.1.1j/[root@hadoop~]#./config--prefix=/usr/local/ssl--shared[root@hadoop~]#ma
作者:编程之家 时间:2022-09-05
你只知大数据的便利,却不知漏洞——hadoop安全完整解析
adoop安全现状Hadoop安全漏洞上图是列出的是Hadoop近年来的一些安全漏洞,接下来会针对其中的几个案例进行简要说明。Apache的Ambari引用给Hadoop带来了很多便利,可以直接通过外部的管理对Hadoop的生态组件进行管控,但在这个过程中由于外部技术的引用,导致了一些外部应用层的漏洞,主要是*
作者:编程之家 时间:2022-09-05
Hadoop文件上传和下载函数
hadoop文件的上传函数IOUtils.copyBytes(fis,fos,configuration);java的文件输入输出流的注意:导入的包的问题,如果导入的包不对会报错,基本上是hadoop包的导入,但是注意这个包:importjava.net.URI;//导入的是net网络的这个包,而不是其他的包实现代码:importorg.apache.hadoo
作者:编程之家 时间:2022-09-05
Hadoop 设置任务执行的队列以及优先级和其他 配置
作业提交到的队列:mapreduce.job.queuename作业优先级:mapreduce.job.priorityPig版本:SETmapreduce.job.queuenameroot.etl.distcp;SETmapreduce.job.priorityHIGH;Hive版本:SETmapreduce.job.queuename=root.etl.distcp;SETmapreduce.job.priority=HIGH;MapReduc
作者:编程之家 时间:2022-09-05
hadoop伪分布式集群搭建
本文步骤较多,请细心查看。基础设施基础设施环境如下:jdk1.7+(提前设置好环境变量)ssh自己和自己之间进行免密登陆,如在layne1上执行sshlayne1时间同步设置本机ip设置主机名可参考Linux切换运行级别、关闭防火墙、禁用selinux、关闭sshd、时间同步、修改时区、拍摄快照、
作者:编程之家 时间:2022-09-05
java实现hdfs文件读写
Java实现hdfs文件读写一、创建javamaven工程对hdfs文件进行读取1、新建maven工程2、修改pom.xml3、java代码二、jar包打包三、args[]传参方法一、创建javamaven工程对hdfs文件进行读取1、新建maven工程新建maven工程,选择quickstart方式填写文件路径名及工程命
作者:编程之家 时间:2022-09-05
Hadoop核心-MapReduce
通过对HDFS的了解,接下来我们接着来学习hadoop第二个核心MapReduce。一.概述*MapReduce是一个分布式计算模型,是用户开发“基于hadoop的数据分析应用”的核心框架。将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上。*
作者:编程之家 时间:2022-09-05
Hadoop概述
Hadoop是什么Hadoop是一个由Apache基金会所开发的分布式系统基础架构。主要解决,海量数据的存储和海量数据的分析计算问题。广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。Hadoop发展历史Hadoop创始人DougCutting,为了实现与Google类似的全文搜索功能,他在Lu
作者:编程之家 时间:2022-09-05
Hadoop集群--详细虚拟机Linux安装配置
Hadoop集群第一章详细虚拟机Linux安装配置在这里插入图片描述软件需求:VMwareWorkstation、Linux镜像文件(QQ群可下载)一、硬件配置1、打开虚拟机–>新建虚拟机–>自定义2、默认3、选择稍后安装操作系统4、选择linux,版本号根据自己的CenOS选择5、
作者:编程之家 时间:2022-09-05
双Hadoop集群&双Kerberos kdc认证跨域互信
两个hera集群开启Kerberos验证后,集群间不能够相互访问,需要实现Kerberos之间的互信,使用hera集群A的客户端访问hera集群B的服务(实质上是使用KerberosRealmA上的Ticket实现访问RealmB的服务)。先决条件:1)两个集群hera.com和yoga.com均开启Kerberos认证2)Kerberos的REALM分别设置为hera
作者:编程之家 时间:2022-09-05
2021-03-20
前言之前的问题换源解决一gredit一个文本编辑器二Hadoop相关命令hh1在master启动Hadoop集群2.列出目录及文件命令3.递归列出目录及文件4.创建目录5.上传文件,有两种方式6.从hdfs上传下载文件cd,有两种方式7.删除HDFS上的文件总结HDFS是Hadoop中独立的一个组件,并
作者:编程之家 时间:2022-09-05
CDH集群大致架构流程图
简介CDH5.12.2安装:https://blog.51cto.com/14839701/2665703本文描述下大致的架构,以帮助安装完之后,做进一步的架构升级与调研。可能有不完善的地方,欢迎指正。大致架构图阐述如上图,整体架构一些主要元素,如下做一些具体的阐述包括大致的功能和想法等等数据来源层结构化数据:关
作者:编程之家 时间:2022-09-05
上一页
31
32
33
34
35
36
37
38
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native