手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
算法
设计模式
多媒体技术
正则表达式
Elasticsearch
Flink
Hadoop
IDE
UML
Promise
Gis
编程之家
Hadoop
奈学 百万大数据架构师
简答说一下hadoop的map-reduce编程模型首先maptask会从本地文件系统读取数据,转换成key-value形式的键值对集合使用的是hadoop内置的数据类型,比如longwritable、text等将键值对集合输入mapper进行业务处理过程,将其转换成需要的key-value在输出之后会进行一个partition分区操
作者:编程之家 时间:2022-09-04
大数据之Hadoop(MapReduce):Reduce输出端采用压缩
目录1.修改驱动2.Mapper和Reducer保持不变基于WordCount案例处理。1.修改驱动packagecom.jinghang.mapreduce.compress;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.
作者:编程之家 时间:2022-09-04
通过CombineTextInputFormat实现小文件优化(调优技能)
文章目录0x00文章内容0x01未修改前情况1.当前文件情况2.执行未修改前作业3.查看结果0x02CombineTextInputFormat实现小文件优化1.修改代码2.执行修改后作业3.查看结果0xFF总结0x00文章内容未修改前情况CombineTextInputFormat实现小文件优化说明:
作者:编程之家 时间:2022-09-04
Hadoop服务器集群崩溃的解决方案
1、正常启动的集群102、103、104在这里模拟某一个节点挂掉(以杀死进程的方式模拟namenode服务器挂掉)这个时候去查看之前上传的文件,依然能够查看,但是该节点已经不能够下载文件,能够查看文件是因为该文件在其他的服务器上有文件备份。点击下载发现下载失败namenode服务
作者:编程之家 时间:2022-09-04
Hadoop环境搭建
啥是大数据?问啥要学大数据? 在我看来大数据就很多的数据,超级多,咱们日常生活中的数据会和历史一样,越来越多!!!大数据有四个特点(4V):大多样快价值学完大数据我们可以做很多事,比如可以对许多单词进行次数查询(本节最后的实验),可以对股市进行分析,所有的学习都是为了赚大钱!(因为是
作者:编程之家 时间:2022-09-04
通过SequenceFile实现合并小文件(调优技能)
文章目录0x00文章内容0x01通过SequenceFile合并小文件1.准备工作2.完整代码0x02检验结果1.启动HDFS和YARN2.执行作业3.查看执行结果0xFF总结0x00文章内容通过SequenceFile合并小文件检验结果说明:Hadoop集群中,元数据是交由NameNode来管理的,每个小文
作者:编程之家 时间:2022-09-04
Hive 安装 以及使用 DataGrip 连接 Hive
Hive安装以及使用DataGrip连接HiveHive安装说明Hive安装前的准备Hive安装Hive启动Hive安装常见的问题Hive安装说明①环境说明Hadoop环境已通过腾讯云服务器完成搭建,我是将hive安装到该hadoop集群的某个节点了Mysql中间件使用的是阿里云的产品
作者:编程之家 时间:2022-09-04
【工具推荐】Hadoop集群监控工具 HTools
https://mulanos.oschina.net/p/htools
作者:编程之家 时间:2022-09-04
报错:Bad connect ack with firstBadLink as 172.17.5.0:50010
防火墙没关:[root@master-30018-30019-30020-qwxg6~]#hadoopfs-puttest.txt/19/02/2314:34:57WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable19/02/2314:36:04INFOhdfs.DFSCl
作者:编程之家 时间:2022-09-04
MYSQL安装无需root权限
1.解压安装包tar-zxvfmysql-5.7.13-linux-glibc2.5-x86_64.tar.gz 2.更改目录名称mvmysql-5.7.13-linux-glibc2.5-x86_64mysql 3.进入mysql并创建目录mkdirlogtmpvardataconf 4.把创建的目录用户和用户组更改为hadoopchownhadoop:
作者:编程之家 时间:2022-09-04
Hdfs的DN节点数据磁盘大小不均衡如何处理
这是一篇历史文章,貌似16还在负责做集群的时候遇到并解决的一问题。之所以发出来是因为感觉比较实用,自从公众号迁移之后,历史文章不能搜索了,所以浪尖每隔一段时间,抽一篇比较实用的历史文章发出来,以便于大家复习和新手来公众号搜索。现象描述建集群的时候,datanode的节点数据磁
作者:编程之家 时间:2022-09-04
获取yarn上APP的状态案例
在星球里和微信群里很多朋友都有疑惑,如何监控yarn上spark或者mr应用的存活状态,浪尖今天在这里分享一下实现方法,实际上只需要简单的几行代码即可。首先是,pom文件,添加yarn相关的配置 <!--https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common--><dependen
作者:编程之家 时间:2022-09-04
Hadoop集群搭建保姆式教学
环境准备三台服务器:node00、node01、node02以及Java环境链接:https://pan.baidu.com/s/1-V_9d2cWBQzy092lyhwQtQ提取码:0000(hadoop3.1.3以及jdk1.8的tar包)安装JDK1、通过xftp将jdk的tar包传入到Linux中2、解压tar-zxvfjdk-8u212-linux-x64.tar.gz-C/usr/local/
作者:编程之家 时间:2022-09-04
记录hadoop3.2.2出现Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster问题
问题:hadoop3.2.2运行集群自带wordcount功能时出现以下错误:[xiaobai@hadoop102hadoop]$hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jarwordcount/wcinput/wcoutputError:Couldnotfindorloadmainclassorg.apache.hadoop.mapreduce.v
作者:编程之家 时间:2022-09-04
D004.1 Dockerfile例子详解及常用指令
教程目录0x00教程内容0x01构建Hadoop集群例子详解1.Hadoop集群Dockerfile文件2.详细解读0x02Dockerfile额外指令说明1.指令总结2.额外五个指令0xFF总结0x00教程内容构建Hadoop集群例子详解Dockerfile额外指令说明0x01构建Hadoop集群例子详解1.H
作者:编程之家 时间:2022-09-04
Hadoop之——hadoop2.5.2eclipse插件编译
最近在搞hadoop,所以编译hadoop-eclipse插件是少不了的!先说下我的编译环境:hadoop:hadoop-2.5.2OS:CentOS6.564位(VMWare虚拟机)eclipse:eclipse-jee-luna-SR1-linux-gtk-x86_64.tar.gz1、下载源码https://github.com/winghc/hadoop2x-eclipse-plugin2.修改配置文件libraries.
作者:编程之家 时间:2022-09-04
从小白程序员到大厂高级技术专家我看过哪些书籍?
有句话叫做:投资啥都不如投资自己的回报率高。从参加工作到现在,短短的几年内,我投资在自己身上的钱已超过三十多万,光买书籍的钱就已超过总投资的三分之一,买了不少于上千本书,有实体书,也有电子书。这些书不仅提升了我的技术能力,更提升了我的视野和认知。作为一名从事互联网行业的技术
作者:编程之家 时间:2022-09-04
2021-06-16
关于在hive中无法查询到端口10000的问题第一张是直接正常启动有问题,第二张图片是按照步骤1执行命令退出安全模式:hadoopdfsadmin-safemodeleave;步骤2执行健康检查,删除损坏掉的block。hdfsfsck/-delete;就可以了
作者:编程之家 时间:2022-09-04
利用sqoop将hive数据导入导出数据到mysql
运行环境 centos5.6 hadoop hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具在使用过程中可能遇到的问题:sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中。sqoop-1.2.0-CDH3B4依赖hadoop-core-0.20.2
作者:编程之家 时间:2022-09-04
hadoop运行java程序的命令,面试必备
什么是SpringBootJava(面向对象编程语言)经过30多年的发展,产生了非常多的优秀框架。Spring(为解决企业应用程序开发的复杂性而创建的框架)曾是最受欢迎的Java框架之一,但随着Node、Ruby、Groovy、PHP等脚本语言的蓬勃发展,使用Spring开发应用就显得繁琐了,因为它使用了大
作者:编程之家 时间:2022-09-04
hiveserver2的配置和启动
概览1.配置hive-site.xml2.配置hadoop中的core-site.xml文件3.测试首先将hive安装然后更改部分配置文件1.配置hive-site.xml利用Xshell工具连接虚拟机进入hive安装目录下的conf文件夹,更改hive-site.xml配置文件其中配置参考hive安装中的配置hive-site.xml你会发现/usr/hive/
作者:编程之家 时间:2022-09-04
什么是中间件
中间件是什么中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源。中间件位于客户机/服务器的操作系统之上,管理计算机资源和网络通讯。是连接两个独立应用程序或独立系统的软件。相连接的系统,即使它们具有不同的接口,但通过中间件相
作者:编程之家 时间:2022-09-04
HDFS的简单学习
上一篇文章将Hadoop环境搭建完毕,下面我们学习一些HDFS的shell操作以及javaapi操作,同时理解hdfs的工作原理HDFS ---> 分布式文件系统 简单说就是把很多数据文件分开放在很多的服务器上,采取分开的方式对很多很多的数据进行分析 namenode 元数据 大哥clo
作者:编程之家 时间:2022-09-04
BigData之Storm:Apache Storm的简介、深入理解、下载、案例应用之详细攻略
BigData之Storm:ApacheStorm的简介、深入理解、下载、案例应用之详细攻略 目录ApacheStorm的简介ApacheStorm的深入理解1、Storm与hadoop2、ApacheStorm的APIApacheStorm的下载Current2.2.xReleaseApacheStorm的案例应用1、ApacheStorm集成 Apa
作者:编程之家 时间:2022-09-04
ubuntu安装配置eclipse+hadoop开发环境十分详细+WordCount实例
https://blog.csdn.net/QYmufeng/article/details/79580582我的环境:系统平台:Ubuntu14.04TLS(64位)Hadoop环境:Hadoop2.8.3Eclipse:Neon.2Release(4.6.2)Eclipse插件:hadoop-eclipse-plugin-2.8.3.jar1.先确保已安装了jdk和hadoop,没有的可参考以下两篇文章,已经安装的跳过此步
作者:编程之家 时间:2022-09-04
hadoop的hdfs分布式存储和mapreduce分布式计算
文章目录2.hdfs(分布式存储)3.mapreduce##1.Hadoop简介-hadoop主流版本:-Apache基金会所开发的分布式系统基础架构(hadoop);-Cloudera版本(Cloudera’sDistributionIncludingApacheHadoop,简称“CDH”),企业化版本;-Hortonworks版本(HortonworksDataPlatform,简称
作者:编程之家 时间:2022-09-04
Hadoop之——计算机网络端口的定义
转载请注明出处:http://blog.csdn.net/l1028386804/article/details/45821877 端口介绍 本文所述端口都是逻辑意义上的端口,是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。我们这里将要介绍的就是逻辑意义上的端口。
作者:编程之家 时间:2022-09-04
hadoop集群安全模式
(1)hdfsdfsadmin-safemodeget (功能描述:查看安全模式状态)(2)hdfsdfsadmin-safemodeenter (功能描述:进入安全模式状态)(3)hdfsdfsadmin-safemodeleave (功能描述:离开安全模式状态)(4)hdfsdfsadmin-safemodewait (功能描述:等待安全模式状态,监控安全模式)
作者:编程之家 时间:2022-09-04
MapReduce之倒排索引
MapReduce之倒排索引一、相关说明二、测试数据三、编程思路四、实现步骤五、打包上传到集群中运行(仅供参考,自行修改)一、相关说明倒排列表概念:倒排列表用来记录有哪些文档包含了某个单词。一般在文档集合里会有很多文档包含某个单词,每个文档会记录文档编号(DocI
作者:编程之家 时间:2022-09-04
Hadoop三大核心组件,hadoop原理
Hadoop的三大核心组件分别是:HDFS(HadoopDistributeFileSystem):hadoop的数据存储工具。YARN(YetAnotherResourceNegotiator,另一种资源协调者):Hadoop的资源管理器。HadoopMapReduce分布式计算框架一.HDFS1.HDFS概述HDFS是google三大论文之一的GFS的开源实现,是一个高
作者:编程之家 时间:2022-09-04
上一页
43
44
45
46
47
48
49
50
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native