手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
算法
设计模式
多媒体技术
正则表达式
Elasticsearch
Flink
Hadoop
IDE
UML
Promise
Gis
编程之家
Hadoop
Hadoop之2.x 搭建
上传hadoop安装包上传到msater的/usr/local/soft/hadoop-2.7.6.tar.gz解压tar-xvfhadoop-2.7.6.tar.gz 配置环境变量vim/etc/profile增加hadoop环境变量,将bin和sbin都配置到PATh中exportJAVA_HOME=/usr/local/soft/jdk1.8.0_171exportHADOOP_HOME
作者:编程之家 时间:2022-09-04
Hadoop 简介
Hadoop特点1.Hadoop是一个能够对大量数据进行分布式处理的软件框架。2.Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。3.Hadoop是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。4.Hadoop还
作者:编程之家 时间:2022-09-04
2021秋9月14日
今天完成了hadoop的搭建 以前一周遇到的问题1.关于hadoop-env.sh和yarn-env.sh的配置遇到的问题:找不到java路径,需要重新配置,javahome=。。。。。。。。。。/jre-1.8.0 yarn配置文件报格式错误解决办法:重新配置
作者:编程之家 时间:2022-09-04
Ubuntu下配置伪分布式Hadoop个人学习仅供参考
Ubuntu下Hadoop伪分布搭建文章目录Ubuntu下Hadoop伪分布搭建Hadoop的三种集群环境1、单机版环境2、伪分布式环境3、完全式环境安装前环境准备设置ssh免密登录安装java、Hadoop,配置环境变量修改Hadoop的配置文件格式化文件,启动集群Hadoop的三种集群环境1、单机版环
作者:编程之家 时间:2022-09-04
Hadoop 2.x安装
1、关闭防火墙 systemctlstopfirewalld.service#停止firewallsystemctldisablefirewalld.service#禁止firewall开机启动查看防火墙状态firewall-cmd--statesystemctlstatusfirewalld.service 2、设置免密钥在master中生成密钥文件ssh-keygen-trsa一直回车将
作者:编程之家 时间:2022-09-04
Hadoop上搭建hive;初始hhive;并运用zeppelin工具
准备阶段1.搭建好Hadoop的服务器。2.hive压缩包 上传至/opt3.zeppelin压缩包 上传至/opt开始搭建 Hive的文件格式Hive的使用创建分区表分区表操作:实际上就是建立一个个的文件夹,将数据按照你的分区约定,分别存放进去。分为静态分区和动态分
作者:编程之家 时间:2022-09-04
Hadoop应用实战100讲三-Hadoop分布式文件系统
前言当大数据到大一定程度时,系统会进行分布存储,HDFS以流式数据访问的模式可以运行到普通的商用服务器集群上,完成了分布式存储的功能,同时也向客户开放了HDFS相应的访问接口,以满足不同的需求。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的
作者:编程之家 时间:2022-09-04
03Linux与Hadoop操作实验
作者:编程之家 时间:2022-09-04
apache tez 编译安装与验证
基本介绍ApacheTez是构建于ApacheHadoopYARN上,基于有向无环图进行数据处理的框架。主要设计主题:授权终端用户表达性数据流定义API灵活的输入处理输出运行模型数据类型无关极易部署执行性能优于mapreduce优化资源管理运行时计划重新配置动态物理数
作者:编程之家 时间:2022-09-04
MR之排序
1、MR中的排序MapTask和ReduceTask均会对数据按照key进行排序。该操作属于Hadoop的默认行为。任何应用程序中的数据均会被排序,而不管逻辑.上是否需要。默认排序是按照字典顺序排序,且实现该排序的方法是快速排序。MapTask它会将处理的结果暂时放到环形缓冲区中,当环形缓冲区
作者:编程之家 时间:2022-09-04
Hadoop安装与wordcount测试
资源准备:hadoop-3.3.1.tar.gzjdk-8u161-linux-x64.tar.gz安装与环境配置:参考这个靠谱的教程(此教程最后的非必须的yarn配置是错的) yarn的正确配置方法:终端键入$hadoopclasspath得到进入文件夹/usr/local/hadoop/etc/hadoop,找到yarn-site.xml按照如图方式配置,其中va
作者:编程之家 时间:2022-09-04
【硬刚Hadoop】HADOOP MAPREDUCE4:MapReduce工作流程
本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的Hadoop部分补充。1.流程示意图,如图4-6,4-7所示图4-6 MapReduce详细工作流程(一)图4-7 MapReduce详细工作流程(二)2.流程详解上面的流程是整个MapReduce最全工作流程,但是Shuffle过程只
作者:编程之家 时间:2022-09-04
3.Linux与Hadoop操作实验
(一)熟悉常用的Linux操作请按要求上机实践如下linux基本命令。cd命令:切换目录(1)切换到目录/usr/local (2)去到目前的上层目录 (3)回到自己的主文件夹 ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 mkdir命令:新建新
作者:编程之家 时间:2022-09-04
Hadoop 数据压缩
Hadoop数据压缩1.概述2.MR支持的压缩编码3.压缩方式选择3.1Gzip压缩3.2Bzip2压缩3.3Lzo压缩3.4Snappy压缩3.5压缩位置选择4.压缩参数配置5.压缩实操案例5.1Map输出端采用压缩5.2Reduce输出端采用压缩1.概述1)压缩的好处和坏处压缩的优点:以减少
作者:编程之家 时间:2022-09-04
hadoop学习记录
Hadoop学习虚拟机安装linux网络配置SSH服务配置免密登录防火墙配置Jdk安装配置环境变量Hadoop安装和集群配置配置环境变量主节点配置将主节点内容分发到子节点zookeeper安装并配置配置环境变量17配置zoo.cfg添加myid文件Hadoop集群测试启动各个节点的zookeeper服务
作者:编程之家 时间:2022-09-04
大数据架构部署2:Hadoop集群搭建
在上一节里,我们使用VMware搭建了三台Linux服务器,并做时间同步。在此基础上,我们将要搭建一套Hadoop集群。 那么这节的目标就很明确了:搭建一套Hadoop集群。 好吧,我们应该把目标说得详细一点:集群包含3个设备,cube01,cube02,cube03,其中namenode处于cube01,cube01,cube02,cube03各包
作者:编程之家 时间:2022-09-04
hdfs命令行指南
Hadoop包括各种shell类命令,它们直接与HDFS和Hadoop支持的其他文件系统交互。bin/hdfsdfs-help列出了Hadoopshell支持的命令。此外,命令bin/hdfsdfs-helpcommand-name可以显示命令的更详细的帮助。这些命令支持大多数普通的文件系统操作,如复制文件、更改文件权限等。
作者:编程之家 时间:2022-09-04
03Linux与Hadoop操作实验
cd命令:切换目录(1)切换到目录/usr/local(2)去到目前的上层目录(3)回到自己的主文件夹 ls命令:查看文件与目录(4)查看目录/usr下所有的文件 mkdir命令:新建新目录(5)进入mp目录,创建一个名为a的目录,并查看有多少目录存在 (6)创建目录a1/a2/a3/a4 rmdir命令:删
作者:编程之家 时间:2022-09-04
大数据之hadoop
简介未完待续架构未完待续安装主机名hadoop100hadoop101hadoop102IP192.168.100.100192.168.100.101192.168.100.102前置要求jdk、zookeeper前置要求节点zkzkzkHDFSJournalNodeJournalNodeJournalNodeNameNodeNameNodeDataNodeDataNodeDataNodeYARNResourceManagerR
作者:编程之家 时间:2022-09-04
MapReduce原理深入理解(二)
1.Mapreduce操作不需要reduce阶段 1importorg.apache.hadoop.conf.Configuration;2importorg.apache.hadoop.fs.FileSystem;3importorg.apache.hadoop.fs.Path;4importorg.apache.hadoop.io.LongWritable;5importorg.apache.hadoop.io.NullWritable;6im
作者:编程之家 时间:2022-09-04
03Linux与Hadoop操作实验
(一)熟悉常用的Linux操作请按要求上机实践如下linux基本命令。cd命令:切换目录(1)切换到目录/usr/(2)去到目前的上层目录(3)回到自己的主文件夹 ls命令:查看文件与目录(4)查看目录/usr下所有的文件 mkdir命令:新建新目录(5)进入mp目录,创建一个名为a的目录,并查看有
作者:编程之家 时间:2022-09-04
1.分布式并行计算实验-WordCount单词计数
在Hadoop集群中测试WordCount功能目标:使用Eclipse+Maven搭建Hadoop开发环境,并能编译运行官方WordCount源码。 创建Hadoop项目 创建Maven项目在创建Maven项目前,请先设置设置好Maven,至少应该将maven镜像修改为国内源在Eclipse中,Fil·e>New>MavenP
作者:编程之家 时间:2022-09-04
大数据在单机进行Hadoop的伪分布式安装安装Linux~Ubuntu 的虚拟机~VirtualBox 和安装 Hadoop
大数据在单机进行Hadoop的伪分布式安装(安装Linux~Ubuntu 的虚拟机~VirtualBox和安装Hadoop) 1,思路:第一步:先在windows安装虚拟机VirtualBox过程:官网:(1)下载:VirtualBox,网址:https://www.virtualbox.org/wiki/Downloads (2)安装:VirtualBox(就安装最新版的,官网还支持的),安
作者:编程之家 时间:2022-09-04
hive 导入数据命令
hadoopfs-ls/hadoopfs-lsmphadoopls-putoot/east_dbgx_202103080820.txtmpvimeast_dbgx_202103080820.txthadoopfs-ls/user/hive/warehousehadoopfs-lsmp/hadoopfs-putoot/east_dbgx_202103080820.txtmp/hive/clouderahive
作者:编程之家 时间:2022-09-04
02-Hadoop集群搭建
Hadoop集群搭建一、环境准备(准备一台模板机)1.1模板机配置—hadoop100模板机不动,为了后面方便克隆,直接添加新的节点虚拟机要求:内存4G,硬盘50G,CentOS7,最小安装这里以hadoop100为模板机,集群配置为hadoop102(nn)、hadoop103(yarn)、hadoop104(2nn)1.1.1虚
作者:编程之家 时间:2022-09-04
java代码上传本地文件到linux服务器,并put到hadoop需要路径版,还会发一个无需路径版
新建工具类:packagecom.lrhealth.mappingintegration.utils;importcom.jcraft.jsch.Channel;importcom.jcraft.jsch.ChannelExec;importcom.jcraft.jsch.ChannelSftp;importcom.jcraft.jsch.JSch;importcom.jcraft.jsch.Session;importcom.jcraft.jsch.UserInfo;i
作者:编程之家 时间:2022-09-04
Hadoop安装步骤
hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等。最新的hadoop-2.4.1又增加了YARN HA注意:apache提供的hadoop-2.4.1的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hadoop-2.4.1就需要重新在64操作系统上重新编
作者:编程之家 时间:2022-09-04
2021-09-21
hadoop集群搭建你要的都在这里spark-2.4.4-bin-hadoop2.7zookeeper-3.4.5-cdh5.14.2.tarjdk-8u221-linux-x64scala-2.12.11apache-hive-2.3.9-bin.tarhadoop-2.7.1.tarjdk-11.0.4_64bitCentOS-7-x86_64-DVD-1810jdk-8u151-linux-x64链接:https://pan.baidu.com/s/1G
作者:编程之家 时间:2022-09-04
03-Hadoop集群启动常见错误
Hadoop集群启动常见错误注意:dfs是在NameNode的机器上起的服务,而yarn是在yarn-site配置时配置的那台机器上启动的服务。常见错误一:重复格式化对于新配置的集群,需要将集群格式化,这时会在hadoop的根目录下多了两个文件夹,一个是data另一个是logs。name和data的clusterID应该
作者:编程之家 时间:2022-09-04
03Linux与Hadoop操作实验
作者:编程之家 时间:2022-09-04
上一页
53
54
55
56
57
58
59
60
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native