【阶段测试2】-大数据基础

本文由用户“ksykkk”分享发布 更新时间:2023-05-26 05:56:54 举报文档

以下为《【阶段测试2】-大数据基础》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

【阶段测试2】-大数据基础

满分分数:100.0

时间限制:-(分钟)

试题数量:28

截止时间:-

一、单项选择题

1、HBase是一种( B )数据库???(2.0分)

A、文档数据库 B、关系数据库 C、列式数据库 D、行式数据库

2、下列数据库属于文档数据库的是( D )???(2.0分)

A、HBase B、Redis C、MySQL D、MongoDB

3、下列关于NoSQL数据库和关系型数据库的比较,不正确的是( A )???(2.0分)

A、NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性

B、NoSQL数据库的可扩展性比传统的关系型数据库更好

C、NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言

D、NoSQL数据库具有弱一致性,关系型数据库具有强一致性

4、HBase三层结构的顺序是( A )???(2.0分)

A、Zookeeper文件,-ROOT-表,.MEATA.表

B、.MEATA.表,Zookeeper文件,-ROOT-表

C、-ROOT-表,Zookeeper文件,.MEATA.表

D、Zookeeper文件,.MEATA.表,-ROOT-表

5、对于HBase数据库而言,每个Region的建议最佳大小是( C )???(2.0分)

A、2GB-4GB B、500MB-1000MB C、1GB-2GB D、100MB-200MB

6、Hive是建立在( C )之上的一个数据仓库。???(2.0分)

A、mysql B、Spark C、hadoop D、HBase

7、下面哪种类型是不被Hive查询语言所支持的。( C )???(2.0分)

A、Map B、String C、Varchar D、Array

8、关于HBase?Shell命令解释错误的是( B )。???(2.0分)

A、create:创建表

B、list:显示表的所有数据

C、put:向某某、行、列指定的单元格添加数据

D、get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值

9、客户端是通过?( A )级寻址来定位Region。???(2.0分)

A、三 B、二 C、一 D、四

10、下列对HBase数据模型的描述错误的是( D )。???(2.0分)

A、每个HBase表都由若干行组成,每个行由行键(row key)来标识

B、HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳

C、HBase列族支持动态扩展,可以很轻松地添加一个列族或列

D、HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本

二、不定项选择题

11、NoSQL数据库的类型包括( ABCD )。???(2.0分)

A、图数据库 B、列族数据库 C、键值数据库 D、文档数据库

12、HBase和传统关系型数据库的区别在于哪些方面:( ABCD )。???(2.0分)

A、数据索引 B、数据操作 C、存储模式 D、可伸缩性

13、以下哪些方法与新增数据增加到表里面的操作有关。?( A )??(2.0分)

A、new ArrayList(); B、new Put(); C、put 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 r)

解析器(SQLParser): 将HQL字符串转换成抽象语法树AST,这一步一般都用第三方工具库完成,比如antlr;对AST进行 语法 分析,比如表是否存在、字段是否存在、SQL语义是否有误。

编译器(Compiler): 对hql语句进行词法、语法、语义的编译(需要跟元数据关联),编译完成后会生成一个执行计划。 hive上就是编译成mapreduce的job。

优化器(Optimizer): 将执行计划进行优化,减少不必要的列、使用分区、使用索引等。优化job。

执行器(Executer): 将优化后的执行计划提交给hadoop的yarn上执行。提交job

5.hadoop

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《【阶段测试2】-大数据基础》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览