手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
算法
设计模式
多媒体技术
正则表达式
Elasticsearch
Flink
Hadoop
IDE
UML
Promise
Gis
编程之家
Hadoop
大数据与Hadoop先导知识
大数据简述 大数据概念 概念大数据(bigdata),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 数据是实施或观察的结果、是对客
作者:编程之家 时间:2022-09-04
电商项目实战-页面浏览量统计功能升级十二
1、PageStartV2App.javasrc/main/java/project/mrv2/PageStartV2App.java与ProvinceStartV2App.java相同重要的是使用logParser.parserv2(log),然后使用pageId作为key值packageproject.mrv2;importorg.apache.commons.lang.StringUtils;importorg.apache.hadoop.conf.Co
作者:编程之家 时间:2022-09-04
MapReduce编程笔记3-计算部门工资
一、分析数据处理的过程二、程序代码2.1main程序importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Job;importorg.apac
作者:编程之家 时间:2022-09-04
Hadoop/Yarn和kafka-logs 日志设置
Hadoop/Yarn的日志清理Hadoop/Yarn的本地日志(非YarnContainer生成的日志)Yarn的Container生成的日志1.Hadoop/Yarn本地日志的清理 Hadoop/Yarn使用log4j进行日志输出,所以对于它们本地日志的清理,最好的方式是通过修改log4j的配置配置文件,以rolling的方式写入
作者:编程之家 时间:2022-09-04
创优视觉科技怎么从零开始学习大数据?
在过去的几年里,大数据创业公司大量增加,都试图处理大数据,帮助组织理解大数据,越来越多的公司正在慢慢采用并转向大数据。 学大数据有两个基本要求: 一、最佳年龄为20-32岁; 二、大专以上学历最好(理科生)优先。 学习大数据的零基,需要由浅入深,循序渐进的入门,这
作者:编程之家 时间:2022-09-04
本地配置hadoop3.0.0开发环境
ThispagesummarizesthestepstoinstallHadoop3.0.0onyourWindowsenvironment.Referencepage:https://wiki.apache.org/hadoop/Hadoop2OnWindowshttps://hadoop.apache.org/docs1.2.1/cluster_setup.htmlinfoAnewerversionofinstallationguideforla
作者:编程之家 时间:2022-09-04
HDFS服役新结点以及退役旧结点
首先我们要明白,HDFS支持热部署如果我们在hadoop集群执行过程中,硬盘内存不足了,想新加一个新节点怎么办?或者有些节点用不到,我们怎么将它退役掉?在HDFS中存在两个配置项:(他们都需要指向一个文件)dfs.hosts:白名单文件,白名单文件中存放的就是HDFS的datanode的地址,在白名单中的地
作者:编程之家 时间:2022-09-04
Snowflake如日中天是否代表Hadoop已死?大数据体系到底是什么?
简介: 本文作者关涛是大数据系统领域的资深专家,在微软(互联网/Azure云事业群)和阿里巴巴(阿里云)经历了大数据发展20年过程中的后15年。本文试从系统架构的角度,就大数据架构热点,每条技术线的发展脉络,以及技术趋势和未解问题等方面做一概述。作者|阿里云计算平台研究员关涛、阿里
作者:编程之家 时间:2022-09-04
大数据课程-------linux部分
【1】linux命令(1)who查找登录的用户(2)last-n(-3)查看最近的登陆历史记录(3)关机/重启shutdown -h now立刻关机shutdown -h+1010分钟以后关机shutdown -h12:00:0012点整的时候关机halt立刻关机shutdown-r now重启reboot(4)查看根目录:ls/查看当前目录:ls.
作者:编程之家 时间:2022-09-04
Hadoop入门(一)——CentOS7下载+VM上安装手动分区图文步骤详解(2021)
Hadoop入门(一)——CentOS7下载+VM上安装(手动分区)图文步骤详解(2021)转写在前面的话,博主刚入大数据的坑,开始在配置环境上走过无数的坑,有些博文上的步骤方法要么就是版本太旧了,要么没有说清楚原理,要么就是可能会行不通,或着自动配置的,不过博主查过许多资料,自定义+手动分
作者:编程之家 时间:2022-09-04
Hive tez引擎安装
安装tez引擎1.解压tez压缩包mkdirteztar-zxvftez-0.10.1-SNAPSHOT.tar.gz2.上传tez-0.10.1-SNAPSHOT.tar.gz到hdfshadoopfs-put/optezez-0.10.1-SNAPSHOT.tar.gzez3.新建tez-site.xmlvim$HADOOP-HOME/etc/hadoopez-site.xml添加<?xmlversion="1.0"e
作者:编程之家 时间:2022-09-04
Hive入门+示例
1、安装mysql5.7(1)安装步骤:centos7下安装mysql5.7-亚萌-博客园(cnblogs.com)(2)镜像中已有 2、进入MySQL(1)注意与hive-site.xml里的mysqljdbc:mysql://hadoop000:3306/hadoop_hive?createDatabaseIfNotExist=true指定mysql,相当于在hadoop000这台机器上的3306端口,3306
作者:编程之家 时间:2022-09-04
Hadoop——基于物品的协同过滤算法实现商品推荐
协同过滤算法:基于物品的协同过滤算法主要有两步:1、计算物品之间的相似度:可依据物品共现次数、余弦夹角、欧氏距离这三种方法计算得到物品之间的相似度。2、根据物品的相似度和用户的历史购买记录给用户生成推荐列表最终推荐的是什么物品,是由推荐度决定的。核心:找出所
作者:编程之家 时间:2022-09-04
Windows下配置Hadoop的Java开发环境以及用Java API操作HDFS
场景HDFS的访问方式之HDFSshell的常用命令:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/119351218在上面使用HDFSshell的方式去访问HDFS。那么怎么使用JavaAPI的方式去操作HDFS。注:博客:https://blog.csdn.net/badao_liumang_qizhi关注公众号霸道的程序
作者:编程之家 时间:2022-09-04
hadoop中使用lzo压缩算法
在hadoop中使用lzo的压缩算法可以减小数据的大小和数据的磁盘读写时间,不仅如此,lzo是基于block分块的,这样他就允许数据被分解成chunk,并行的被hadoop处理。这样的特点,就可以让lzo在hadoop上成为一种非常好用的压缩格式。lzo本身不是splitable的,所以当数据为text格式时,用lzo压
作者:编程之家 时间:2022-09-04
java高分面试指南:hadoop
4.刷新设置,运行hadoopversion查看是否配置成功source/etc/profile5.修改hadoop的核心配置文件5.1修改hadoop-env.sh mapred-env.sh yarn-env.shvimhadoop-env.shexportJAVA_HOME=/usr/local/jdk5.2修改core-site.xml<property>
作者:编程之家 时间:2022-09-04
HDFS导入导出文件
HDFS常规操作#在HDFS创建文件夹hadoopfs-mkdir/attachment#创建文件hadoopfs-touchest.txt#删除文件hadoopfs-rm-rest.txt#删除文件夹hadoopfs-rm-r/attachment#从HDFS里递归拷贝attachment文件夹到本地指定目录temp下hadoopdfs-get/att
作者:编程之家 时间:2022-09-04
101_Hadoop简介
目录Hadoop简介1什么是Hadoop2Hadoop的特点3Hadoop的优缺点ApacheHadoop的重要组成ApacheHadoop完全分布式集群搭建1搭建虚拟机集群1.1创建一台虚拟机1.2给虚拟机挂载操作系统1.3开启虚拟机并安装操作系统1.4配置静态IP1.5防火墙相关命令1.6配置hostname1.7配置IP映
作者:编程之家 时间:2022-09-04
Hadoop单机版安装部署
设置免密登录 解压tar-zxvfhadoop-2.10.1.tar.gz-C/opt解压后路径:/opt/hadoop-2.10.1配置环境变量打开配置文件vim/etc/profile添加内容(文件末尾添加)exportHADOOP_HOME=/opt/hadoop-2.10.1exportPATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$
作者:编程之家 时间:2022-09-04
CDH搭建Hadoop集群(Centos7)
一、说明 节点(CentOS7.5)Server ||AgentCPUnode11Server ||Agent4Gnode12Agent2Gnode13Agent2G二、系统环境搭建1、网络配置(所有节点)1.设置主机名和IP2.配置/etc/hosts IP和主机名的映射 2、SSH免密码登录1.产生公钥和私钥:ssh-keygen
作者:编程之家 时间:2022-09-04
大数据发行版本与云厂商
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。Hadoop云厂商:阿里云飞天、腾讯云TBDSApache http://hadoop.apache.org/Apachehadoop软件库是一个框架,它允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。它被设计成从单个服务器扩展到数千台机器,每台
作者:编程之家 时间:2022-09-04
105_实例
MapReduce编程有三个⽂文件file1、file2、file3,⽂文件中每⼀一⾏行行都是⼀一个数字,如下所示。file1.txt:232654321575665223file2.txt:59561165092file3.txt:26546请编写MapReduce程序实现如下需求:MapReduce程序读取这三个文件,对三个文件中的数字进行整体升序
作者:编程之家 时间:2022-09-04
MapReduce Java API-多输入路径方式
场景MapReduceJavaAPI实例-统计单词出现频率:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/119410169在上面实现统计单次出现的频率的基础上。数据集只是单路径,如果有多个数据集文件,即有多个txt文件,要怎么实现。多文件输入采用MultipleInputs.addInputPath方
作者:编程之家 时间:2022-09-04
基于虚拟机CentOS7搭建hadoop集群
基于虚拟机CentOS7搭建hadoop集群第一部分准备工作1安装虚拟机Windows环境下安装VmwareWorkStation;Macintel环境下安装VmwareFushion;MacM1环境下安装PararellDesktop;具体见参考链接1。2下载centos(提供下载地址)3虚拟机安装centos(大部分选择默认选项即可,缺乏图形
作者:编程之家 时间:2022-09-04
每周总结--Hadoop的学习(2)
这周完成内容:1.添加shell脚本-xsync,实现集群间的文件复制#!/bin/bash#1.判断参数个数if[$#lt1]thenechoNotEnoughArguement!exit;fi#2.遍历集群所有机器forhostincentos01centos02centos03doecho====================$host====================#3.遍历所有
作者:编程之家 时间:2022-09-04
hadoop之hdfs
Hadoop之HDFS1.1HDFShdfs是分布式的文件管理系统优点:缺点:,不支持低延时的数据访问。例如毫秒级的。,无法对大量的小文件进行存储 存储大量小文件的话,它会占用NameNode大量的内存来存储文件目录和块信息。这样是不可取的,因为NameNode的内存总是有
作者:编程之家 时间:2022-09-04
从小白程序员到大厂高级技术专家我看过哪些书籍?
大家好,我是冰河~~有句话叫做:投资啥都不如投资自己的回报率高。从参加工作到现在,短短的几年内,我投资在自己身上的钱已超过三十多万,光买书籍的钱就已超过总投资的三分之一,买了不少于上千本书,有实体书,也有电子书。这些书不仅提升了我的技术能力,更提升了我的视野和认知。作为一名从
作者:编程之家 时间:2022-09-04
大数据同步工具DataX、Sqoop、Canal之比较
1.Sqoop与DataXSqoop依赖于Hadoop生态,充分利用了map-reduce计算框架,在Hadoop的框架中运行,对HDFS、Hive支持友善,在处理数仓大表的速度相对较快,但不具备统计和校验能力。DataX无法分布式部署,需要依赖调度系统实现多客户端,可以在传输过程中进行过滤,并且可以统计传输数据的信息,因此
作者:编程之家 时间:2022-09-04
Hadoop框架
1.在Hadoop1.0版本中,Hadoop是有许多缺点的。比如,迭代计算效率低下,因为每一次map和reduce前,会读取hdfs中的数据,然后本次执行完毕后,会把数据存储到hdfs中,反复读取hdfs中的数据,降低了迭代计算的效率。所以在Hadoop2.0后,就有了spark,它是基于内存的分布式并行编程框架,具有较高的实时性
作者:编程之家 时间:2022-09-04
从零搭建Hadoop——1.安装虚拟机
前言本教程适合Hadoop小白,但是需要有一定的Linux基础。能力有限,如有不正确的地方还请批评指正,谢谢兄弟姐妹们~一、下载镜像文件我们使用的是centos7,兄弟姐妹们可以去官网下载或者中文镜像网站下载,也可以用我的镜像文件。链接:https://pan.baidu.com/s/1FaQ0QRkvomyf297A0
作者:编程之家 时间:2022-09-04
上一页
49
50
51
52
53
54
55
56
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native