以下为《技术名词英文缩写》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
DW:数据仓库技术,Data Warehousing,数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。
OLAP:On-Line Analytical Processing,联机分析处理,数据分析的目标则是探索并挖掘数据价值,作为企业高层进行决策的参考。
OLTP:On-Line Transaction Processing,联机事务处理,业务类系统主要供基层人员使用,进行一线业务操作,通常被称为OLTP(。
RUM:read,update,memory
DBMS:DBMS是用于存储和管理数据的软件
RDMS(RDBMS):Relational Database Management System关系型数据库管理系统,表格形式
Flink
Storm
Spark
Kafka
Cahe和buffer的区别
Botchcache,streaming
ETL,ELT:Extract-Transform-Load,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
KV:Key-Value Store,Key-Value存储系统,指的是一类通过键/值对进行数据存取的NoSQL数据库,具有与传统RDMS不同的新型存储结构,如图片、视频、HTML文档等,基于LSM-Tree。
LSM-Tree:The Log-Structured Merge-Tree ,系统写日志不需要更改,只需要在后边追加。(日志结构的基本就指代追加)。注意他还是个 “Merge-tree”,也就是“合并-树”,合并就是把多个合成一个。
HDFS要求高一致性,吞吐量大,GFS低一致性
LSMT
Hive
Hidi
GFS,BGFS,DBFS
分布式文件系统的四大要点:
1 分离的物理地址
2 多线程
3 相互通信
4 有共同目标
结构化数据和非结构化数据
HA高某某
Standby
Memorycache
Mstore
ES
Squirrel
Chunk,chunkserver,metaserver
/
通信方式:1.共享地址空间 2.消息通信
Yarn:Hadoop集群的资源管理系统。把所有的机器可用资源(包括内存,cpu等)放到一个池子里,来服务时分配资源,也就是说,有了Yarn,各种应用就可以互不干扰的运行在同一个Hadoop系统中,共享整个集群资源 。
数据仓库
数据湖
数据孤岛
SSTable
ODS:Operational Data Store,操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复杂性,而且ODS的数据周期一般比较短。ODS的数据最终流入DW。
DM:Data Mart,数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据。面向应用。
Binlog
Log
DB:
JDBC
DAL,DAO
RPC:Remote Procedure Call,远程过程调用,简单的理解是一个节点请求另一个节点提供的服务
书:DDIA
DW:数据仓库技术,Data Warehousing,数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。
GFS,BGFS,DBFS
分布式文件系统的四大要点:
1 分离的物理地址
2 多线程
3 相互通信
4 有共同目标
结构化数据和非结构化数据
HA高某某
Standby
Memorycache
Mstore
ES
Squirrel
Chunk,chunkserver,metaserver
通信方式:1.共享地址空间 2.消息通信
Yarn
数据仓库
数据湖
数据孤岛
SSTable
ODS
DM
Binlog
Log
DB
JDBC
DAL,DAO
RPC
SOP:标准作业流程
zw02-data-hdp-dn25317
zw02-data-hdp-dn25319
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《技术名词英文缩写》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。