以下为《01 数据仓库》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
什么是数据仓库(DW)、数据集市(DM)、操作数据存储(ODS)和ETL
数据仓库是一个专为实现商业智能活动而设计的数据库:它旨在帮助用户理解和增强其组织的绩效。它专为查询分析而不是交易处理而设计,通常包含从交易数据派生出来的历史数据,但也可以包含来自其他来源的数据。数据仓库将分析工作负载从交易工作负载中分离出来,并使组织能够整合来自多个来源的数据。
除了关系型数据库的功能,数据仓库环境还可以包含抽取、传输、转换和加载(ETL)功能,统计分析,报告,数据挖掘功能,客户端分析工具,以及管理数据收集过程、将数据转化为有用的、可操作的信息、并将其交付给业务用户的其他应用程序。
数据仓库中的数据通常来自多个数据源,通过抽取、转换、加载(ETL)过程来完成载入。现代数据仓库正朝着抽取、加载、转换(ELT)的架构发展,其中所有或大多数的数据转换都在托管数据仓库的数据库上执行。重点需要注意的是,数据仓库设计工作的很大一部分是定义ETL过程。同样,ETL过程的速度和可靠性是数据仓库上线运行后的基础。
数据集市与数据仓库的作用类似,但范围有限,它通常只服务于某个特定部门或业务线。数据集市相对于数据仓库的优势在于:由于其覆盖范围有限,它可以被 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 数据吞吐量的快速查询性能是成功数据仓库的关键
数据仓库通常的任务
典型的Oracle数据仓库管理员或设计人员,需要参与以下任务:
配置Oracle数据库用作数据仓库
设计数据仓库
升级数据库和数据仓库软件至新版本
管理schema对象,例如表,索引和物理化视图
管理用户和安全
开发用于抽取,转换和加载(ETL)过程的程序
根据数据仓库中的数据创建报表
备份数据仓库,并在需要时执行恢复操作
监控数据仓库的性能,并根据需要采取预防或纠正措施
在中小型数据仓库环境中,可能只有一个或几个人执行上述任务。 在大型企业环境中,这些工作通常由几个DBA和设计人员分担,每个人都有自己的专长,例如数据库安全或数据库调优。
典型的数据仓库架构:包含了数据缓存区和数据集市
/
这张图的5点说明:
数据源(业务系统和文本文件)
数据缓存区(数据加载进数据仓库前先进入数据缓存区)
数据仓库(元数据、汇总数据和原始数据)
数据集市(采购数据集市、销售数据集市,库存数据集市)
用户(数据分析用户、报表用户、数据挖掘用户)
如果您有兴趣,请参考《数据仓库概念》: Introduction to Data Warehousing Concepts
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《01 数据仓库》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。