手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
算法
设计模式
多媒体技术
正则表达式
Elasticsearch
Flink
Hadoop
IDE
UML
Promise
Gis
编程之家
Hadoop
Hadoop全分布配置
前言:安装系统环境配置 1.解压缩hadoop安装包 tar -zvxf /hadoop安装包所在位置 -C 解压目的地 2.修改名字(将Hadoop解压后的名字改为 hadoop(他原先的名字后面带有版本号)) mv /原hadoop解压后位置 /更改名后hadoop位置 3.配置环境
作者:编程之家 时间:2022-09-04
使用 Oracle Load For HadoopOLH实现数据湖到Oracle数据库数据集成
1前言 企业在建设数据平台过程中,凭借大数据解决方案,企业能够收集处理大量低结构化的原始数据(如 Web 日志、社交媒体数据、电子邮件、传感器数据和位置数据),它们可以为业务应用程序提供丰富的实用信息。同时,在企业中关系数据库(大多数商业应用所采用的平台)中包含
作者:编程之家 时间:2022-09-04
Hadoop学习笔记之Hadoop伪分布式环境搭建
搭建为伪分布式Hadoop环境1、宿主机(Windows)与客户机(安装在虚拟机中的Linux)网络连接。a) Host-only 宿主机与客户机单独组网;好处:网络隔离;坏处:虚拟机和其他服务器之间不能通讯;b) Bridge 桥接 宿主机与客户机在同一个局域网中。好处:窦在同一个局域网,可以互相访问;坏处:不完全。2、H
作者:编程之家 时间:2022-09-04
CDH5 完美手动配置过程改进版
一、安装前准备:操作系统:CentOS 6.5 64位操作系统环境:jdk1.7.0_45以上,本次采用jdk-7u55-linux-x64.tar.gzmaster01 10.10.2.57 namenode 节点master02 10.10.2.58 namenode 节点slave01:10.10.2.173 datanode 节点slave02:10.10.2.59 datanode 节点slave03: 10.
作者:编程之家 时间:2022-09-04
hadoop环境的配置
1、所需软件所需要的环境包括java,ssh必须保证sshd一直运行,以便用Hadoop脚本管理远端Hadoop守护进程Windows下的附加软件需求Cygwin提供上述软件之外的shell支持。2、安装软件sudoapt-getinstallsshsudoapt-getinstallrsync由于hadoop是基于java编写的,因此需
作者:编程之家 时间:2022-09-04
Hadoop 学习笔记之Hive安装
先看一下什么是Hive,Hive是Hadoop的一个子项目,它是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库 表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的M
作者:编程之家 时间:2022-09-04
hadoop HA 详细安装步骤
下载百度搜索hadoop进入官网(https://hadoop.apache.org)下载 翻到最下面,选择releasearchive 找到对应的版本 选择tar.gz下载 安装前基础配置修改Hostname临时修改hostnamehostnamebigdata01hostname永久生效vi/etc/sysconfigetwork添加NETWORKING=ye
作者:编程之家 时间:2022-09-04
转载:删了HDFS又能怎样?记一次删库不跑路事件
一、事发背景上个月的某一天,由于集群空间不足,公司有一位技术经理级别的大数据leader在通过跳板机在某个线上集群执行手动清理命令,疯狂地执行hadoopfs-rmr-skipTrash/user/hive/warehouse/xxxxx,突然,不知道是编辑器的问题还是换行问题,命令被截断,命令变成了hadoopfs-rmr-s
作者:编程之家 时间:2022-09-04
Hadoop简易执行集群
操作 1.配置Hadoop格式化 NameNode 格式化 su - hadoop cd /hadoop的路径/ bin/hdfs namenode -format 2.启动NameNode
作者:编程之家 时间:2022-09-04
Hadoop集群安装SSH无密登录
前言:集群配置需要三台主机集群网络配置主机配置修改 1.修改主机一 hostnamectl set-hostname dxc(自定义主机一名字) 2.修改主机二 hostnamectl set-hostname dxc2(自定义主机二名字) 3.修改主机三
作者:编程之家 时间:2022-09-04
【hadoop】安装JDK
1、配置LINUX用户具有root权限Root用户输入vim/etc/sudoers将root的权限复制一下。用户名改为hadoop1012、安装JDK2.1卸载系统自带的openJDK查看java版本 java–version查看java安装软件 rpm-qa|grepjava卸载openjdk .noarch可以不用删除 使用rpm-e--nodep
作者:编程之家 时间:2022-09-04
Hadoop平台安装
前言::Hadoop的搭建环境是CentOS7.4环境搭建1.主机ip绑定 1.查看服务器的 IP 地址 ip address show 2.设置服务器的主机名称 hostnamectl set-hostname dxc 3.查看设置
作者:编程之家 时间:2022-09-04
帝小辰所有博客总目录集合
前言:一切为了更简单理论知识:先有理论才有更好的方向去实践大数据知识点1.JSTL常用标签库:一些常用的JSTL标签2.Sqoop简易知识:Sqoop是一个用于在Hadoop和关系数据库服务器之间传输数据的工具,3.类SQL—HIVE:是基于Hadoop的一个数据仓库工具。4.客户端Cookie:将临时数据保
作者:编程之家 时间:2022-09-04
Hadoop学习笔记—Yarn
目录一些基本知识ResourceManager的恢复ResourceManager的HAYARNNodeLabelsYARNNodeAttributesWebApplicationProxyYARNTimelineServer基于yarn的API,编写一个可以部署到yarn集群执行的应用应用安全NodeManagerHealthCheckerServiceCGroupswithYARNSecureContainer
作者:编程之家 时间:2022-09-04
【hadoop】-linux下配置配置主机名
LINUX配置主机名1、输入:hostnamectl或者hostname查看主机名2、Root用户vim/etc/sysconfigetwork 添加NETWORKING=yesHOSTNAME=hadoop101克隆虚拟机只需修改HOSTNAME3、vi/etc/hostname修改主机名4、vim/etc/hosts配置IP与主机名 5、修改完成后reboot重启生
作者:编程之家 时间:2022-09-04
4、安装jdk和hadoop
handoop集群搭(3)一、安装jdk1、将jdk和handoop导入三台虚拟机中2、安装jdk①进入root用户:su②cd/usr③mkdirjava④cdjava⑤tar-zxvf/home/user/myfile/jdk-8u144-linux-x64.tar.gz #解压安装包3、配
作者:编程之家 时间:2022-09-04
Total jobs = 1 Launching Job 1 out of 1 Number of reduce tasks determined at compile time: 1 In orde
Totaljobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes): sethive.exec.reducers.bytes.per.reducer=<number>Inordertolimitthemaximumnumberofreducer
作者:编程之家 时间:2022-09-04
搭建学习大数据,需要的虚拟机Linux集群环境
网页右边,向下滑有目录索引,可以根据标题跳转到你想看的内容如果右边没有就找找左边本文是我学习尚硅谷Hadoop3.1.x的学习笔记视频资源地址:https://www.bilibili.com/video/BV1Qp4y1n7EN?p=34&spm_id_from=pageDriver一、搞3台做实验的虚拟机1、搭建Linux虚拟机环境由于篇
作者:编程之家 时间:2022-09-04
Zookeeper简易实践操作
下载安装Zookeeper 1.解压zookeeper tar -zvxf /zookeeper安装包所在路径 -C /zookeeper解压后所在路径 2.修改名字 mv /带版本号zookeeper的路径 /改名
作者:编程之家 时间:2022-09-04
hadoop3.2下MapReduce操作出现错误: 找不到或无法加载主类org.apache.hadoop.mapreduce.v2.app.MRAppMaster 问题解决方法
转载于 https://www.cnblogs.com/guoxiangyue/p/13929829.html执行MapReduce操作时,出现错误,提示找不到主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster。在网上搜索找到解决方法,记录如下:在命令行下输入如下命令,并将返回的内容复制。# hadoop classpath
作者:编程之家 时间:2022-09-04
数据清洗
数据清洗什么是ETLETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企
作者:编程之家 时间:2022-09-04
Hadoop 2.7.7 伪分布式安装
Hadoop2.7.7伪分布式安装伪分布式:一个集群的所有角色都分布式在一个节点。注意区分一个概念:单机模式一、Hadoop介绍Hadoop从2.x开始,就开始分化了。逐渐演变成:HDFS、YARN、MapReduce三大应用模块,这三个应用模块分别的能力和作用是:1、HDFS:分布式文件系统,用来解决海量大
作者:编程之家 时间:2022-09-04
VirtualBox + CentOS7 搭建 Hadoop 伪分布式模式
一、准备好CentOS7的ISO文件,JDK1.8安装文件,hadoop-2.7安装文件链接:https://pan.baidu.com/s/1lmA0Ai9ivPftJgC6DbpN7g 提取码:iw3g 二、安装CentOS7系统没有截图的页面默认配置直接下一步 三、CentOS7环境准备root登录系统1、关闭防火墙查看当前防火墙状
作者:编程之家 时间:2022-09-04
Python项目实战:使用PySpark对大数据进行分析
Python项目实战:使用PySpark对大数据进行分析大数据,顾名思义就是大量的数据,一般这些数据都是PB级以上。PB是数据存储容量的单位,它等于2的50次方个字节,或者在数值上大约等于1000个TB。这些数据的特点是种类繁多,有视频、有语音、有图片、有文字等等。面对这么多数据,使用常规技术就
作者:编程之家 时间:2022-09-04
flume到底会丢数据吗?
什么时候最容易出问题呢?——flush到HDFS的时候组容易出问题 如:flush到HDFS的时候,可能由于网络原因超时(或者集群宕机)导致数据传输失败,这个时候同样地调用doRollback方法来进行回滚,回滚的时候,由于takeList中还有备份数据,所以将takeList中的数据原封不动地还给channel,这时候就完
作者:编程之家 时间:2022-09-04
【Mac】mac you-get 安装及使用
1.概述刷抖音看到一个视频,视频上面可以使用you-get下载网页视频。然后我就是试试2.安装you-get安装pipinstallyou-getyou-getMac电脑安装brewinstallyou-get可能会安装失败[lcc@lcc~/soft/hadoop/hadoop-2.7.4]$brewinstallyou-getUpdatingHomebrew
作者:编程之家 时间:2022-09-04
ubuntu下安装hadoop和eclipse
hadoop安装方法:https://www.cnblogs.com/oskyhg/p/9150000.htmlhadoop安装教程本教程由厦门大学数据库实验室/给力星出品,转载请注明。本教程适合于原生Hadoop2,包括Hadoop2.6.0,Hadoop2.7.1等版本,主要参考了官方安装教程,步骤详细,辅以适当说明,相信按照步骤来,都能
作者:编程之家 时间:2022-09-04
大数据学习demo
大数据学习demo,相关的测试数据在根目录test文件下,具体可以参考demo。demo地址:https://github.com/carteryh/big-data一、hadoophadoop本地运行及调试。相比在集群环境运行,不用那么繁琐。demo主要是一些简单的hadoop3案例,案例基本都是在本地运行demo,这样不用每
作者:编程之家 时间:2022-09-04
元数据管理篇之Altas
一.简介1.概述Atlas是一个可伸缩且功能丰富的数据管理系统,深度集成了Hadoop大数据组件。简单理解就是一个跟Hadoop关系紧密的,可以用来做元数据管理的一个系统,整个结构图如下所示官网:https://www.cloudera.com/products/open-source/apache-hadoop/apache-atla
作者:编程之家 时间:2022-09-04
hadoop集群搭建
环境:配好IP,关闭iptables,关闭selinux,配置hosts配置hosts:192.168.1.18xinsz08-1192.168.1.20xinsz08-64192.168.1.11xinsz08-62三台服务器上都要创建普通用户,hadoop,配置密码:123456[root@xinsz08-64 ~]# useradd -u 8000 hadoop ; echo 123456 | passwd --stdin
作者:编程之家 时间:2022-09-04
上一页
34
35
36
37
38
39
40
41
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native