微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

hadoop和maven

1、大数据有哪些特点?
valume(大量)
veLocity(高速)
variety(多样)
value(低价值密度)
2、什么是大数据?
指无法在一定的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
3、大数据是用来解决什么的?
主要解决,海量数据的存储和海量数据的分析计算问题。
4、What is Hadoop?
分布式系统基础架构
5、Hadoop有哪些优势?
高可靠性:hadoop底层维护多个数据副本,即使hadoop某个计算元素或 存储出现故障,也不会导致数据的丢失
高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点
高效性 :在MapReduce的思想下,Hadoop是并行工作的,以加快任务处 理速度
6、sudo命令用处?
可为Hadoop用户增加管理员权限,方便不熟,避免比较棘手的权限问题
7、使用sudo时有几点需要注意的?
用户在执行sudo命令时要求输入账号密码,如果验证失败,sudo命令将会退出
8、Hadoop 2个组件-HDFS\YARN,1个思想(框架)MapReduce,它们的组成架构。
HDFS: NameNode(nn)存储文件的元数据
Datanode(dn)在本地系统存储文件块数据
Secondary NameNode(2nn) 每隔一段时间对NameNode元 数据备份
YARN :ResourceManager
Nodemanager
ApplicationMaster
Container
MapReduce: MapReduce将计算过程分为两个阶段,Map和Reduce
map阶段并行处理输入数据
Reduce阶段对Map结果进行汇总

9、中大型企业,大数据部门都由什么组成?
大数据部门组织结构:平台组,数据仓库组,实时组,数据挖掘组,报表开 发组
10、pom是什么意思?
Project Object Model,项目对象模型。
11、依靠什么可以在Maven仓库中确定一个唯一的Maven工程?
依靠Maven坐标,其表示为groupid+artifactid+version
12、请介绍Maven中坐标概念
[1]groupId:公司或组织的域名倒序+当前项目名称 [2]artifactId:
当前项目的模块名称 [3]version:当前模块的版本
13、请简单介绍使用Maven的原因
添加第三方jar包jar包间的依赖关系、获取第三方jar包
14、Maven可以对Java程序进行自动化构建的原因是
约定>配置>编码。意思就是能用配置解决的问题就不编码,
能基于约定的就不进行配置。
而Maven正是因为指定了特定文件保存的目录才能够对我们的Java工程进行自动化构建。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐