微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

大数据技术原理与应用——练习题

第一章 大数据概述

1第三次信息化浪潮的标志是:

  • A.互联网的普及

  • B.云计算、大数据、物联网技术的普及

  • C.个人电脑的普及

  • D.虚拟现实技术的普及

2就数据的量级而言,1PB数据是多少TB?

  • A.1000

  • B2048

  • C.1024

  • D.512

3以下关于云计算、大数据和物联网之间的关系,论述错误的是:

  • A.物联网可以借助于云计算实现海量数据的存储

  • B.物联网可以借助于大数据实现海量数据的分析

  • C.云计算侧重于数据分析

  • D.云计算、大数据和物联网三者紧密相关,相辅相成

4以下哪个不是大数据时代新兴的技术:

  • A.HBase

  • B.Spark

  • C.MysqL

  • D.Hadoop

5每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:

  • A.Storm

  • B.MapReduce

  • C.pregel

  • D.Dremel

6每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:

  • A.S4

  • B.Hive

  • C.GraphX

  • D.Impala

7每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:

  • A.Flume

  • B.pregel

  • C.Storm

  • D.Cassandra

8每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:

  • A.S4

  • B.HDFS

  • C.Dremel

  • D.MapReduce

9数据产生方式大致经历了三个阶段,包括

  • A.感知式系统阶段

  • B.移动互联网数据阶段

  • C.运营式系统阶段

  • D.用户原创内容阶段

10大数据发展的三个阶段是:

  • A.成熟期

  • B.低谷期

  • C.大规模应用期

  • D.萌芽期

11大数据的特性包括

  • A.价值密度低

  • B.数据量大

  • C.处理速度快

  • D.数据类型繁多

12图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历了哪几种范式:

  • A.数据密集型科学

  • B.理论科学

  • C.计算科学

  • D.实验科学

13大数据带来思维方式的三个转变是:

  • A.精确而非全面

  • B.相关而非因果

  • C.全样而非抽样

  • D.效率而非精确

14大数据主要有哪几种计算模式:

  • A.查询分析计算

  • B.图计算

  • C.流计算

  • D.批处理计算

15云计算的典型服务模式包括三种:

  • A.SaaS

  • B.IaaS

  • C.MaaS

  • D.PaaS

第2章 大数据处理架构Hadoop

1启动hadoop所有进程的命令是:

  • A.start-all.sh

  • B.start-hdfs.sh

  • C.start-dfs.sh

  • D.start-hadoop.sh

2以下对Hadoop的说法错误的是:

  • A.Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算

  • B.Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性

  • C.Hadoop的核心是HDFS和MapReduce

  • D.Hadoop是基于Java语言开发的,只支持Java语言编程

3以下哪个不是Hadoop的特性:

  • A.支持多种编程语言

  • B.高容错性

  • C.成本高

  • D.高可靠性

4以下名词解释不正确的是:

  • A.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统

  • B.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现

  • C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储

  • D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现

5以下哪些组件是Hadoop的生态系统的组件:

  • A.MapReduce

  • B.HBase

  • C.Oracle

  • D.HDFS

6以下哪个命令可以用来操作HDFS文件:

  • A.hadoop fs

  • B.hdfs dfs

  • C.hadoop dfs

  • D.hdfs fs

第3章 分布式文件系统HDFS

1HDFS的命名空间不包含:

  • A.块

  • B.字节

  • C.文件

  • D.目录

2对HDFS通信协议的理解错误的是:

  • A.客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互

  • B.客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的

  • C.HDFS通信协议都是构建在IoT协议基础之上的

  • D.名称节点和数据节点之间则使用数据节点协议进行交互

3采用多副本冗余存储的优势不包含:

  • A.节约存储空间

  • B.保证数据可靠性

  • C.加快数据传输速度

  • D.容易检查数据错误

4假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:

  • A.start-dfs.sh,stop-dfs.sh

  • B.start-hdfs.sh,stop-dfs.sh

  • C.start-hdfs.sh,stop-hdfs.sh

  • D.start-dfs.sh,stop-hdfs.sh

5分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫    ,另一类存储具体数据叫    :

  • A.名称节点,数据节点

  • B.名称节点,主节点

  • C.数据节点,名称节点

  • D.从节点,主节点

6下面关于分布式文件系统HDFS的描述正确的是:

  • A.分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现

  • B.分布式文件系统HDFS比较适合存储大量零碎的小文件

  • C.分布式文件系统HDFS是Google Bigtable的一种开源实现

  • D.分布式文件系统HDFS是一种关系型数据库

7以下对名称节点理解正确的是:

  • A.名称节点通常用来保存元数据

  • B.名称节点的数据保存在内存中

  • C.名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问

  • D.名称节点用来负责具体用户数据的存储

8以下对数据节点理解正确的是:

  • A.数据节点通常只有一个

  • B.数据节点用来存储具体的文件内容

  • C.数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作

  • D.数据节点的数据保存在磁盘中

9HDFS只设置唯一一个名称节点带来的局限性包括:

  • A.隔离问题

  • B.性能的瓶颈

  • C.集群的可用性

  • D.命名空间的限制

10以下HDFS相关的shell命令不正确的是:

  • A.hadoop fs -ls <path>:显示<path>指定的文件的详细信息

  • B.hadoop dfs mkdir <path>:创建<path>指定的文件

  • C.hadoop fs -copyFromLocal <path1> <path2>:将路径<path2>指定的文件文件夹复制到路径<path1>指定的文件夹中

  • D.hdfs dfs -rm <path>:删除路径<path>指定的文件

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐