云计算章节测验（无答案）

本文由用户“huangzexing”分享发布更新时间：2021-07-01 21:01:50 举报文档

以下为《云计算章节测验（无答案）》的无排版文字预览，完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的，下载的文档就是什么样的。

第一章章节测验

1.[单选题]

下列数据属于结构化数据的是

A.职工信息表

B.人脸图片集

C.HTML网页

D.XML

2.[单选题]

下列不属于大数据架构平台的是

A.Hadoop

B.HDFS

C.SQLSever

D.MapReduce

3.[单选题]

下列属于数据采集解决的工具的是

A.ETL工具

B.SVM

C.SPARK

D.Kmeans

4.[单选题]

数据清洗与预处理阶段的工作主要是：

A.使用工具对数据进行分类汇总，通过数据来挖掘数据背后的联系，分析原因，找出规律，然后应用到实际业务中。

B.数据去重，异常处理，数据归一化等

C.直观地展现大数据的特点

D.抽取分布的，异构数据源中的数据到临时文件或者数据库中。

5.[单选题]

下列属于并行计算的描述是

A.每个处理器都有独享的内存，数据交换通过网络完成

B.处理器共享内存

C.处理器共享同一IP地址

D.处理器有独立的硬盘存储

6.[单选题]

下列不属于分布式文件系统的是

A.GFS

B.HDFS

C.Ceph

D.FAT

7.[单选题]

不属于分布式数据库的是

A.HBase

B.MongoDB

C.MySQL

D.ScaleBase

8.[单选题]

下列不属于数据仓库的特点是

A.面向主题的

B.集成的

C.易变化的

D.反映历史变化的

9.[单选题]

下面关于云计算和虚拟化的关系描述不正确的是

A.云计算是一个概念，虚拟化是一种具体技术。

B.虚拟化是云计算之后的应用。

C.虚拟化是云计算中的一部分。

D.云计算的基础是虚拟化。

10.[单选题]

下列与虚拟化技术关系不大的是

A.容器技术

B.KVM技术

C.Linux内核

D.Intel VT

11.[多选题]

大数据技术涉及我们社会生活的层面有：

A.微博

B.朋友圈

C.打车

D.网购

12.[多选题]

各行各业意识到了大数据的价值，涌现出了

A.工业大数据

B.金融大数据

C.医疗大数据

D.教育大数据

13.[多选题]

大数据根据结构可划分为

A.结构化数据

B.非结构化数据

C.混合型数据

D.半结构化数据

14.[多选题]

大数据处理流程的步骤：

A.数据采集

B.数据清洗与预处理

C.数据统计分析和挖掘

D.结果可视化

15.[多选题]

下列属于分布式计算可能出现的问题是

A.编译错误

B.一致性

C.数据完整性

D.任务调度

16.[多选题]

分布式文件系统的关键技术有

A.元数据管理

B.系统可扩展性

C.存储层级Qg的优化技术

D.针对应用和负载的优化

17.[多选题]

常见的虚拟化产品有

A.WMware

B.Virtualbox

C.OpenStack

D.Docker

18.[填空题]

大数据的4个特性是（中文描述）：

(1)

(2)

(3)

(4)

19.[填空题]

分布式数据库的特征有

(1)

(2)

(3)

20.[填空题]

Hadoop的核心是

(1)

(2)

(3)

21.[判断题]

XML和HTML属于结构化数据（）

22.[判断题]

结构化数据具有固定的结构，属性划分，以及类型等信息。利于关系数据库中的学生表。（）

23.[判断题]

企业中大部分是结构化数据。（）

24.[判断题]

大数据的价值密度较低（）

25.[判断题]

MapReduce属于分布式计算机程序（）

26.[判断题]

数据仓库是主要用于支持管理决策的。（）

27.[判断题]

分布式计算和并行解决没有区别，完全一样。（）

28.[判断题]

MLlib是Hadoop生态中的机器学习库。

（）

29.[判断题]

Giraph是Hadoop生态数据挖掘算XX。（）

30.[判断题]

Hive是Hadoop的数据仓库工具。（）

第三章章节测验

1.[单选题]

下列对HBase数据模型的描述错误的是

A.HBase是一个稀疏、多维度、排序的映射表，这张表的索引是行键、列族、列限定符和时间戳

B.HBase列族支持动态扩展，可以很轻松地添加一个列族或列

C.HBase中执行更新操作时，会删除数据旧的版本，并生成一个新的版本

D.每个HBase表都由若干行组成，每个行由行键（row key）来标识

2.[单选题]

下面关于NoSQL数据库和关系数据库不正确的是

A.NoSQL数据库具有弱一致性，关系型数据库具有强一致性

B.NoSQL数据库缺乏统一的查询语言，而关系型数据库有标准化查询语言

C.NoSQL数据库的可扩展性比传统的关系型数据库更好

D.NoSQL数据库很容易实现数据完整性，关系型数据库很难实现数据完整性

3.[单选题]

下列哪个是文档数据库

A.MySQL

B.MongoDB

C.HBase

D.Redis

4.[单选题]以下对Hadoop的说法错误的是

A.Hadoop是基于JAVA语言开发的,只支持JAVA语言编程

B.Hadoop2.0增加了NameNode和wire-conpatibility 两个重大特性

C.Hadoop核心是HDFS和MapReduce

D.Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算

5.[单选题]以下哪个不是hadoop的特性

A.高可靠性

B.高容错性

C.高成本

D.支持多种编程语言

6.[单选题]HDFS的命名空间不包含

A.字节

B.文件

C.块

D.目录

7.[单选题]采用多副本冗余存储的优势不包含

A.节约存储空间

B.保证数据可靠性

C.容易检查数据错误

D.加快传输速度

8.[单选题]下面关于分布式文件系统HDFS的描述正确的是

A.分布式文件系统HDFS比较适合存储大量零碎的小文件

B.分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现

C.分布式文件系统HDFS是Google Bigtable的一种开源实现

D.分布式文件系统HDFS是一种关系型数据库

9.[单选题]

对于HBase数据库而言，每个Region的建议最佳大小是

A.500MB-1000MB

B.1GB-2GB

C.2GB-4GB

D.100MB-200MB

10.[单选题]

Hadoop的两大核心是和

A.GFS; MapReduce

B.HDFS; HBase

C.HDFS; MapReduce

D.MapReduce; HBase

11.[多选题]

下列对HBase的理解正确的是

A.HBase多用于存储非结构化和半结构化的松散数据

B.HBase是一个行式分布式数据库，是Hadoop生态系统中的一个组件

C.HBase是针对谷歌BigTable的开源实现

D.HBase是一种关系型数据库，现成功应用于互联网服务领域

12.[多选题]

HBase和传统关系型数据库的区别在于哪些方面：

A.数据模型

B.数据维护

C.可伸缩性

D.存储模式

13.[多选题]

NoSQL数据库的类型包括

A.列族数据库

B.图数据库

C.文档数据库

D.键值数据库

14.[多选题]以下对名称节点理解正确的是

A.名称节点用来负责具体用户数据的存储

B.名称节点的数据保存在内存中

C.名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问

D.名称节点通常用来保存元数据

15.[多选题]以下对数据节点理解正确的是

A.数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作

B.数据节点通常只有一个

C.数据节点的数据保存在磁盘中

D.数据节点用来存储具体的文件内容

16.[多选题]

NoSQL数据库的类型包括

A.键值数据库

B.文档数据库

C.列族数据库

D.图数据库

17.[填空题]

Hbase是一种数据库（行式/列式）

18.[填空题]

分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫。

19.[填空题]

1TB = ( )MB

20.[填空题]

NoSQL的含义是

21.[判断题]

HDFS采用了主从结构模型，包含多个名称节点和多个数据节点。（）

22.[判断题]

大数据时代数据存储与管理技术包括分布式文件系统、NewSQL和NoSQL数据库、云数据库等。（）

23.[判断题]

传统的关系数据库和NoSQL数据库各有所长，不存在一方完全取代另一方的问题，在很长的一段时期内，二者都会共同存在，满足不同应用的差异化需求。（）

24.[判断题]

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台，是基于Java语言开发的，具有很好的跨平台特性。（）

第四章章节测验

1.[单选题]

下列说法错误的是

A.不同的Map任务之间不能互相通信

B.Map函数将输入的元素转换成形式的键值对

C.MapReduce框架采用了Master/Slave架构，包括一个Master和若干个Slave

D.Hadoop框架是用Java实现的，MapReduce应用程序则一定要用Java来写

2.[单选题]

在使用MapReduce程序WordCount进行词频统计时，对于文本行“hello hadoop hello world”，经过WordCount程序的Map函数处理后直接输出的中间结果，应该是下面哪种形式：

A.、和

B.、和

C.、和

D.、、和

3.[单选题]

对于文本行“hello hadoop hello world”，经过WordCount的Reduce函数处理后的结果是

4.[单选题]

TaskTracker 使用来等量划分本节点上的资源量（CPU、内存等）。

A.slot

B.task

C.job

D.client

5.[多选题]

下列关于传统并行计算框架（比如MPI）和MapReduce并行计算框架比较正确的是

A.前者相比后者学习起来更难

B.前者所需硬件价格贵，可扩展性差，后者硬件便宜，扩展性好

C.前者适用于实时、细粒度计算、计算密集型，后者适用于批处理、非实时、数据密集型

D.前者是共享式(共享内存/共享存储)，容错性差，后者是非共享式的，容错性好

6.[多选题]

MapReduce体系结构主要由哪几个部分组成

A.TaskTracker

B.JobTracker

C.Task

D.Client

7.[多选题]

下面哪些属于大数据处理与分析技术

A.MapReduce

B.Spark

C.Hive

D.SPSS

8.[多选题]

下面哪些方式产生的数据是图结构数据

A.社交网络

B.传染病传播途径

C.传感监测

D.交通事故对路网的影响

9.[多选题]

下列适用于批处理计算的框架有哪些

A.Pregel

B.Storm

C.MapReduce

D.Spark

10.[填空题]

MapReduce采用策略，一个存储在分布式文件系统中的大规模数据集，会被切分成许多独立的分片，这些分片可以被多个Map任务并行处理。

11.[填空题]

所谓过程，是指对Map输出结果进行分区、排序、合并等处理，并交给Reduce的过程。

12.[填空题]

广义的数据分析包括和。

(1)

(2)

13.[判断题]

MapReduce设计的一个理念就是“计算向数据靠拢”，而不是“数据向计算靠拢”，因为，移动数据需要大量的网络传输开销。（）

14.[判断题]

广义的数据分析和狭义的数据分析没什么区别。（）

15.[判断题]

Map Reduce处理的是大规模静态数据

（）

16.[判断题]

流计算是针对流数据的实时计算（）

第五章章节测验

1.[单选题]

大数据采集下列说法错误的是

A.来源广泛，数据量巨大

B.数据类型丰富，包括结构化、半结构化和非结构化

C.分布式数据库，分布式文件系统

D.来源单一，数据量相对较少

2.[单选题]

关于数据采集源错误的是

A.传感器

B.互联网

C.书籍报刊

D.日志文件

3.[单选题]

一个字节有（）二进制位

A.16

B.8

C.2

D.10

4.[单选题]

计算机中最早的字符编码是（），一个字节只占7个二进制位，最高位为0

A.ASCII

B.UTF

C.UTF-8

D.GBK

5.[单选题]

向服务器发出请求后，服务器回复响应状态码是200代表（）

A.成功

B.服务器内部错误

C.服务器拒绝访问

D.应使用代理访问

6.[单选题]

在python中需要导入requests完成对页面的请求，正确的代码是

A.include requests

B.including requests

C.import requests

D.importing requests

7.[单选题]

python中获得相应对象的文本信息的属性是

A.content

B.context

C.text

D.txt

8.[单选题]

requests库中获取数据的编码的属性是

A.encode

B.encoding

C.decode

D.decoding

9.[单选题]

从网页爬取一张图片，需要把Reponse对象的内容以二进制数据的形式返回，使用属性（）

A.text

B.binary

C.context

D.content

10.[单选题]

requests库发送了请求，然后得到了服务器的响应，使用方法（）

A.post

B.get

C.put

D.delete

11.[判断题]

手机拍照功能属于传感器数据采集的一部分（）

12.[判断题]

互联网数据的采集通常是借助于网络爬虫来完成的。（）

13.[判断题]

网络爬虫不能爬取视频文件( )

14.[判断题]

网络爬虫爬取的非结构化数据不能存储在传统的结构化数据库中( )

15.[判断题]

通过数据源采集到数据后可直接进行存储（）

16.[判断题]

通用爬虫只需要爬行与主题相关的页面，极大地节省了硬件和网络资源（）

17.[判断题]

数据清洗包括缺失值处理、异常值处理、数据类型转换和重复值处理。（）

18.[判断题]

数据脱敏不仅要执行“数据漂白”，抹去数据中的敏感内容，还要保证脱敏前后的数据一致性和有效性（）

19.[判断题]

数据在内存当中处理时，使用的格式是GBK，统一标准。（）

20.[判断题]

Robots协议用来告诉爬虫，哪些页面是可以抓取的，哪些不可以。（）

第六章章节测验

1.[单选题]

数据仓库的特点不包括（）

A.面向主体

B.面向对象

C.集成的

D.相对稳定的

2.[单选题]

对数据仓库的理解正确的是（）

A.数据仓库就是数据库，二者没有什么区别

B.数据仓库系统被称为OLTP

C.数据仓库面向的用户一般是管理人员或决策层

D.数据仓库里面保存数据都是最新的数据

3.[单选题]

数据仓库里面的数据特征不包括（）

A.大量的历史数据

B.提供了汇总和聚集机制

C.可以用于查询和联机事务处理

D.可以在不同的粒度级别、不同的维度视角来存储和管理数据

4.[单选题]

数据仓库中采用的数据模型不包括（）

A.E-R模型

B.星形

C.雪花形

D.事实星座

5.[单选题]

OLTO的数据访问模式不包括（）

A.主要由短的原子事务所组成

B.既有读操作也有写操作，

C.只能提供读操作

D.需要考虑事务管理、并发控制和故障恢复等机制。

6.[单选题]

数据仓库管理系统的提供商不包括（）

A.Oracle

B.NCR

C.IBM

D.iphone

7.[单选题]

数据仓库管理系统在数据仓库体系结构中属于（）

A.数据源

B.OLAP引擎

C.前端工具和应用

D.数据存储及管理

8.[单选题]

OLAP引擎的分类不包括（）

A.ROLAP

B.MOLAP

C.HOLAP

D.OLTP

9.[单选题]

下列属于多维分析的基本分析动作的是（）

A.上扬

B.下降

C.旋转

D.拉伸

10.[单选题]

Hive是一个基于（）的数据仓库工具

A.HADOOP

B.HDFS

C.MapReduce

D.HiveQL

11.[多选题]数据仓库的数据 ETL 过程中， ETL 软件的主要功能包括（）

A? 数据抽取 ?????B? 数据转换 ??????C? 数据加载 ??????D? 数据稽核数

12.[多选题]

下列对数据仓库的理解正确的是（）

A.数据仓库用于支持管理和决策，面向分析型数据处理

B.数据仓库是对多个异构的数据源有效集成

C.数据仓库是按照一定的主题域进行组织。

D.面向整个企业的分析处理，数据已经集成，消除了数据的不一致性。

正确答案：ABCD

13.[多选题]

数据仓库中的数据（）

A.实时更新，数据根据需要及时发生变化

B.定期加载，加载后的数据极少更新

C.主要关心当前数据

D.包含历史数据

14.[多选题]

操作性数据库与数据仓库的区别不包括（）

A.数据的内容不同

B.访问模式不同

C.数据的视图不同

D.产品不一样

15.[多选题]

在Hadoop生态系统中与Hive相联系的其他组件有（）

A.HDFS

B.PIG

C.MapReduce

D.HBase

16.[填空题]

数据管理技术的发展可以分为三个阶段，分别是_________、__________、___________。

17.[填空题]

数据仓库的特点包括________、________、________、________、________。

18.[填空题]

数据仓库系统的体系结构包括_________、_________、_________、_________。

19.[填空题]

在星形模式中，它的事实（中心表）描述信息有______、______。

20.[填空题]

多维分析的基本分析动作包括________、________、________、________、________。

21.[判断题]

Hive依赖于HDFS 存储数据，Hive依赖于MapReduce 处理数据。（）

22.[判断题]

OLTP系统面向一般的客户和知识工人或者管理决策人员，并提供数据分析功能。（）

23.[判断题]

操作型数据库是面向特殊处理任务，各个系统之间各自分离。（）

24.[判断题]

操作内容过长，仅展示头部和尾部部分文字预览，全文请查看图片预览。，则最终生成的画面需达到：

A.真，就是真实性

B.善，就是易感知

C.美，就是艺术性

D.善，就是有良知

9.[多选题]

可视分析学涉及到的学科包括：

A.计算机图形学

B.数据挖掘

C.人机交互

D.统计分析

10.[多选题]

数据可视化的作用包括：

A.观测、跟踪数据

B.分析数据

C.辅助理解数据

D.增强数据吸引力

11.[判断题]

从数据清洗、数据整合、数据组织、数据分析到最终的知识获取，可视化在这个链条的每个环节中都发挥着互助互利的作用。（）

12.[判断题]

人类的认知十分有限，在利用可视化探索数据的过程中毫无作用。（）

13.[判断题]

可视分析以可视交互界面为通道，利用视觉感知通道和交互可视化，将人类的感知和认识通过可视化融入数据的处理，形成人脑智能和机器智能优势互补和相互提升，建立螺旋式的信息交流和知识提炼，完成理解、推理和决策等任务。（）

14.[判断题]

在对可展示的数据进行筛选时，要确保不能展示过多数据，同时也不能展示过少数据。（）

15.[判断题]

在考虑数据可视化的目标时，能帮助人理解数据、分析数据，比效果美观酷炫更重要。（）

[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。

以上为《云计算章节测验（无答案）》的无排版文字预览，完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的，下载的文档就是什么样的。

云计算章节测验（无答案）

图片预览

热门关注

相关下载