云计算章节测验(无答案)

本文由用户“huangzexing”分享发布 更新时间:2021-07-01 21:01:50 举报文档

以下为《云计算章节测验(无答案)》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

第一章章节测验

1.[单选题]

下列数据属于结构化数据的是

A.职工信息表

B.人脸图片集

C.HTML网页

D.XML

2.[单选题]

下列不属于大数据架构平台的是

A.Hadoop

B.HDFS

C.SQLSever

D.MapReduce

3.[单选题]

下列属于数据采集解决的工具的是

A.ETL工具

B.SVM

C.SPARK

D.Kmeans

4.[单选题]

数据清洗与预处理阶段的工作主要是:

A.使用工具对数据进行分类汇总,通过数据来挖掘数据背后的联系,分析原因,找出规律,然后应用到实际业务中。

B.数据去重,异常处理,数据归一化等

C.直观地展现大数据的特点

D.抽取分布的,异构数据源中的数据到临时文件或者数据库中。

5.[单选题]

下列属于并行计算的描述是

A.每个处理器都有独享的内存,数据交换通过网络完成

B.处理器共享内存

C.处理器共享同一IP地址

D.处理器有独立的硬盘存储

6.[单选题]

下列不属于分布式文件系统的是

A.GFS

B.HDFS

C.Ceph

D.FAT

7.[单选题]

不属于分布式数据库的是

A.HBase

B.MongoDB

C.MySQL

D.ScaleBase

8.[单选题]

下列不属于数据仓库的特点是

A.面向主题的

B.集成的

C.易变化的

D.反映历史变化的

9.[单选题]

下面关于云计算和虚拟化的关系描述不正确的是

A.云计算是一个概念,虚拟化是一种具体技术。

B.虚拟化是云计算之后的应用。

C.虚拟化是云计算中的一部分。

D.云计算的基础是虚拟化。

10.[单选题]

下列与虚拟化技术关系不大的是

A.容器技术

B.KVM技术

C.Linux内核

D.Intel VT

11.[多选题]

大数据技术涉及我们社会生活的层面有:

A.微博

B.朋友圈

C.打车

D.网购

12.[多选题]

各行各业意识到了大数据的价值,涌现出了

A.工业大数据

B.金融大数据

C.医疗大数据

D.教育大数据

13.[多选题]

大数据根据结构可划分为

A.结构化数据

B.非结构化数据

C.混合型数据

D.半结构化数据

14.[多选题]

大数据处理流程的步骤:

A.数据采集

B.数据清洗与预处理

C.数据统计分析和挖掘

D.结果可视化

15.[多选题]

下列属于分布式计算可能出现的问题是

A.编译错误

B.一致性

C.数据完整性

D.任务调度

16.[多选题]

分布式文件系统的关键技术有

A.元数据管理

B.系统可扩展性

C.存储层级Qg的优化技术

D.针对应用和负载的优化

17.[多选题]

常见的虚拟化产品有

A.WMware

B.Virtualbox

C.OpenStack

D.Docker

18.[填空题]

大数据的4个特性是(中文描述):

(1)

(2)

(3)

(4)

19.[填空题]

分布式数据库的特征有

(1)

(2)

(3)

20.[填空题]

Hadoop的核心是

(1)

(2)

(3)

21.[判断题]

XML和HTML属于结构化数据( )

22.[判断题]

结构化数据具有固定的结构,属性划分,以及类型等信息。利于关系数据库中的学生表。( )

23.[判断题]

企业中大部分是结构化数据。( )

24.[判断题]

大数据的价值密度较低( )

25.[判断题]

MapReduce属于分布式计算机程序( )

26.[判断题]

数据仓库是主要用于支持管理决策的。( )

27.[判断题]

分布式计算和并行解决没有区别,完全一样。( )

28.[判断题]

MLlib是Hadoop生态中的机器学习库。

( )

29.[判断题]

Giraph是Hadoop生态数据挖掘算XX。( )

30.[判断题]

Hive是Hadoop的数据仓库工具。( )

第三章章节测验

1.[单选题]

下列对HBase数据模型的描述错误的是

A.HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳

B.HBase列族支持动态扩展,可以很轻松地添加一个列族或列

C.HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本

D.每个HBase表都由若干行组成,每个行由行键(row key)来标识

2.[单选题]

下面关于NoSQL数据库和关系数据库不正确的是

A.NoSQL数据库具有弱一致性,关系型数据库具有强一致性

B.NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言

C.NoSQL数据库的可扩展性比传统的关系型数据库更好

D.NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性

3.[单选题]

下列哪个是文档数据库

A.MySQL

B.MongoDB

C.HBase

D.Redis

4.[单选题]以下对Hadoop的说法错误的是

A.Hadoop是基于JAVA语言开发的,只支持JAVA语言编程

B.Hadoop2.0增加了NameNode和wire-conpatibility 两个重大特性

C.Hadoop核心是HDFS和MapReduce

D.Hadoop MapReduce是针对 谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算

5.[单选题]以下哪个不是hadoop的特性

A.高可靠性

B.高容错性

C.高成本

D.支持多种编程语言

6.[单选题]HDFS的命名空间不包含

A.字节

B.文件

C.块

D.目录

7.[单选题]采用多副本冗余存储的优势不包含

A.节约存储空间

B.保证数据可靠性

C.容易检查数据错误

D.加快传输速度

8.[单选题]下面关于分布式文件系统HDFS的描述正确的是

A.分布式文件系统HDFS比较适合存储大量零碎的小文件

B.分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现

C.分布式文件系统HDFS是Google Bigtable的一种开源实现

D.分布式文件系统HDFS是一种关系型数据库

9.[单选题]

对于HBase数据库而言,每个Region的建议最佳大小是

A.500MB-1000MB

B.1GB-2GB

C.2GB-4GB

D.100MB-200MB

10.[单选题]

Hadoop的两大核心是 和

A.GFS; MapReduce

B.HDFS; HBase

C.HDFS; MapReduce

D.MapReduce; HBase

11.[多选题]

下列对HBase的理解正确的是

A.HBase多用于存储非结构化和半结构化的松散数据

B.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件

C.HBase是针对谷歌BigTable的开源实现

D.HBase是一种关系型数据库,现成功应用于互联网服务领域

12.[多选题]

HBase和传统关系型数据库的区别在于哪些方面:

A.数据模型

B.数据维护

C.可伸缩性

D.存储模式

13.[多选题]

NoSQL数据库的类型包括

A.列族数据库

B.图数据库

C.文档数据库

D.键值数据库

14.[多选题]以下对名称节点理解正确的是

A.名称节点用来负责具体用户数据的存储

B.名称节点的数据保存在内存中

C.名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问

D.名称节点通常用来保存元数据

15.[多选题]以下对数据节点理解正确的是

A.数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作

B.数据节点通常只有一个

C.数据节点的数据保存在磁盘中

D.数据节点用来存储具体的文件内容

16.[多选题]

NoSQL数据库的类型包括

A.键值数据库

B.文档数据库

C.列族数据库

D.图数据库

17.[填空题]

Hbase是一种 数据库(行式/列式)

18.[填空题]

分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫 。

19.[填空题]

1TB = ( )MB

20.[填空题]

NoSQL的含义是

21.[判断题]

HDFS采用了主从结构模型,包含多个名称节点和多个数据节点。( )

22.[判断题]

大数据时代数据存储与管理技术包括分布式文件系统、NewSQL和NoSQL数据库、云数据库等。( )

23.[判断题]

传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会共同存在,满足不同应用的差异化需求。( )

24.[判断题]

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台特性。( )

第四章章节测验

1.[单选题]

下列说法错误的是

A.不同的Map任务之间不能互相通信

B.Map函数将输入的元素转换成形式的键值对

C.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave

D.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写

2.[单选题]

在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:

A.、和

B.、和

C.、和

D.、、和

3.[单选题]

对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是

A.

B.

C.

D.

4.[单选题]

TaskTracker 使用 来等量划分本节点上的资源量(CPU、内存等)。

A.slot

B.task

C.job

D.client

5.[多选题]

下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是

A.前者相比后者学习起来更难

B.前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好

C.前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型

D.前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好

6.[多选题]

MapReduce体系结构主要由哪几个部分组成

A.TaskTracker

B.JobTracker

C.Task

D.Client

7.[多选题]

下面哪些属于大数据处理与分析技术

A.MapReduce

B.Spark

C.Hive

D.SPSS

8.[多选题]

下面哪些方式产生的数据是图结构数据

A.社交网络

B.传染病传播途径

C.传感监测

D.交通事故对路网的影响

9.[多选题]

下列适用于批处理计算的框架有哪些

A.Pregel

B.Storm

C.MapReduce

D.Spark

10.[填空题]

MapReduce采用 策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。

11.[填空题]

所谓 过程,是指对Map输出结果进行分区、排序、合并等处理,并交给Reduce的过程。

12.[填空题]

广义的数据分析包括 和 。

(1)

(2)

13.[判断题]

MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。( )

14.[判断题]

广义的数据分析和狭义的数据分析没什么区别。( )

15.[判断题]

Map Reduce处理的是大规模静态数据

( )

16.[判断题]

流计算是针对流数据的实时计算( )

第五章章节测验

1.[单选题]

大数据采集下列说法错误的是

A.来源广泛,数据量巨大

B.数据类型丰富,包括结构化、半结构化和非结构化

C.分布式数据库,分布式文件系统

D.来源单一,数据量相对较少

2.[单选题]

关于数据采集源错误的是

A.传感器

B.互联网

C.书籍报刊

D.日志文件

3.[单选题]

一个字节有()二进制位

A.16

B.8

C.2

D.10

4.[单选题]

计算机中最早的字符编码是(),一个字节只占7个二进制位,最高位为0

A.ASCII

B.UTF

C.UTF-8

D.GBK

5.[单选题]

向服务器发出请求后,服务器回复响应状态码是200代表()

A.成功

B.服务器内部错误

C.服务器拒绝访问

D.应使用代理访问

6.[单选题]

在python中需要导入requests完成对页面的请求,正确的代码是

A.include requests

B.including requests

C.import requests

D.importing requests

7.[单选题]

python中获得相应对象的文本信息的属性是

A.content

B.context

C.text

D.txt

8.[单选题]

requests库中获取数据的编码的属性是

A.encode

B.encoding

C.decode

D.decoding

9.[单选题]

从网页爬取一张图片,需要把Reponse对象的内容以二进制数据的形式返回,使用属性()

A.text

B.binary

C.context

D.content

10.[单选题]

requests库发送了请求,然后得到了服务器的响应,使用方法()

A.post

B.get

C.put

D.delete

11.[判断题]

手机拍照功能属于传感器数据采集的一部分( )

12.[判断题]

互联网数据的采集通常是借助于网络爬虫来完成的。( )

13.[判断题]

网络爬虫不能爬取视频文件( )

14.[判断题]

网络爬虫爬取的非结构化数据不能存储在传统的结构化数据库中( )

15.[判断题]

通过数据源采集到数据后可直接进行存储( )

16.[判断题]

通用爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源( )

17.[判断题]

数据清洗包括缺失值处理、异常值处理、数据类型转换和重复值处理。( )

18.[判断题]

数据脱敏不仅要执行“数据漂白”,抹去数据中的敏感内容,还要保证脱敏前后的数据一致性和有效性( )

19.[判断题]

数据在内存当中处理时,使用的格式是GBK,统一标准。( )

20.[判断题]

Robots协议用来告诉爬虫,哪些页面是可以抓取的,哪些不可以。( )

第六章章节测验

1.[单选题]

数据仓库的特点不包括()

A.面向主体

B.面向对象

C.集成的

D.相对稳定的

2.[单选题]

对数据仓库的理解正确的是()

A.数据仓库就是数据库,二者没有什么区别

B.数据仓库系统被称为OLTP

C.数据仓库面向的用户一般是管理人员或决策层

D.数据仓库里面保存数据都是最新的数据

3.[单选题]

数据仓库里面的数据特征不包括()

A.大量的历史数据

B.提供了汇总和聚集机制

C.可以用于查询和联机事务处理

D.可以在不同的粒度级别、不同的维度视角来存储和管理数据

4.[单选题]

数据仓库中采用的数据模型不包括()

A.E-R模型

B.星形

C.雪花形

D.事实星座

5.[单选题]

OLTO的数据访问模式不包括()

A.主要由短的原子事务所组成

B.既有读操作也有写操作,

C.只能提供读操作

D.需要考虑事务管理、并发控制和故障恢复等机制。

6.[单选题]

数据仓库管理系统的提供商不包括()

A.Oracle

B.NCR

C.IBM

D.iphone

7.[单选题]

数据仓库管理系统在数据仓库体系结构中属于()

A.数据源

B.OLAP引擎

C.前端工具和应用

D.数据存储及管理

8.[单选题]

OLAP引擎的分类不包括()

A.ROLAP

B.MOLAP

C.HOLAP

D.OLTP

9.[单选题]

下列属于多维分析的基本分析动作的是()

A.上扬

B.下降

C.旋转

D.拉伸

10.[单选题]

Hive是一个基于()的数据仓库工具

A.HADOOP

B.HDFS

C.MapReduce

D.HiveQL

11.[多选题]数据仓库的数据 ETL 过程中, ETL 软件的主要功能包括( )

A? 数据抽取 ?????B? 数据转换 ??????C? 数据加载 ??????D? 数据稽核 数

12.[多选题]

下列对数据仓库的理解正确的是()

A.数据仓库用于支持管理和决策,面向分析型数据处理

B.数据仓库是对多个异构的数据源有效集成

C.数据仓库是按照一定的主题域进行组织。

D.面向整个企业的分析处理,数据已经集成,消除了数据的不一致性。

正确答案:ABCD

13.[多选题]

数据仓库中的数据()

A.实时更新,数据根据需要及时发生变化

B.定期加载,加载后的数据极少更新

C.主要关心当前数据

D.包含历史数据

14.[多选题]

操作性数据库与数据仓库的区别不包括()

A.数据的内容不同

B.访问模式不同

C.数据的视图不同

D.产品不一样

15.[多选题]

在Hadoop生态系统中与Hive相联系的其他组件有()

A.HDFS

B.PIG

C.MapReduce

D.HBase

16.[填空题]

数据管理技术的发展可以分为三个阶段,分别是_________、__________、___________。

17.[填空题]

数据仓库的特点包括________、________、________、________、________。

18.[填空题]

数据仓库系统的体系结构包括_________、_________、_________、_________。

19.[填空题]

在星形模式中,它的事实(中心表)描述信息有______、______。

20.[填空题]

多维分析的基本分析动作包括________、________、________、________、________。

21.[判断题]

Hive依赖于HDFS 存储数据,Hive依赖于MapReduce 处理数据。( )

22.[判断题]

OLTP系统面向一般的客户和知识工人或者管理决策人员,并提供数据分析功能。( )

23.[判断题]

操作型数据库是面向特殊处理任务,各个系统之间各自分离。( )

24.[判断题]

操作 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 ,则最终生成的画面需达到:

A.真,就是真实性

B.善,就是易感知

C.美,就是艺术性

D.善,就是有良知

9.[多选题]

可视分析学涉及到的学科包括:

A.计算机图形学

B.数据挖掘

C.人机交互

D.统计分析

10.[多选题]

数据可视化的作用包括:

A.观测、跟踪数据

B.分析数据

C.辅助理解数据

D.增强数据吸引力

11.[判断题]

从数据清洗、数据整合、数据组织、数据分析到最终的知识获取,可视化在这个链条的每个环节中都发挥着互助互利的作用。( )

12.[判断题]

人类的认知十分有限,在利用可视化探索数据的过程中毫无作用。( )

13.[判断题]

可视分析以可视交互界面为通道,利用视觉感知通道和交互可视化,将人类的感知和认识通过可视化融入数据的处理,形成人脑智能和机器智能优势互补和相互提升,建立螺旋式的信息交流和知识提炼,完成理解、推理和决策等任务。( )

14.[判断题]

在对可展示的数据进行筛选时,要确保不能展示过多数据,同时也不能展示过少数据。( )

15.[判断题]

在考虑数据可视化的目标时,能帮助人理解数据、分析数据,比效果美观酷炫更重要。( )

[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。

  1. 形势与政策(2020年春)章节测验答案
  2. 华为笔试题目
  3. 超星学习通新冠肺炎防控第1课练习题及答案
  4. 疫情对居民收入水平和消费的影响-默认报告
  5. 服饰类国潮品牌消费情况调查问卷
  6. 疫情防控期间居民社会心态调查问卷
  7. 云南白药调查问卷
  8. 这是一份关于乡村文化振兴的调查问卷-默认报告
  9. 中小学教师疫情期间心理健康调查问卷
  10. 三基考试 急救知识试卷
  11. 从草根到殿堂 题库
  12. “战新冠疫情,现中国精神”主题调查问卷_c
  13. 研发考试题答案
  14. 疫情期间大学生对身边的党员、党组织认知度调研
  15. 《习在两会上的各种重要讲话》重要试题及答案
  16. 运动与免疫调查问卷
  17. 税法第一次作业 -含答案税法第一次作业 -含答案

以上为《云计算章节测验(无答案)》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览