当前位置: 代码迷 >> 数据仓库 >> 数据仓库ETL工具箱之总结(一)
  详细解决方案

数据仓库ETL工具箱之总结(一)

热度:1427   发布时间:2013-02-26 00:00:00.0
数据仓库ETL工具箱之小结(一)

       数据仓库是一个将源系统数据抽取、清洗、规格化、提交到维度数据存储的系统,为
决策的制定提供查询和分析功能的支撑与实现.

 

一.数据仓库中的常见术语:

   1.数据仓库(Data Warehouse)

   2.数据集市(Data Mart)

   3. 操作型数据存储(ODS,Operational Data Store)

   4.企业数据仓库(EDW,Enterprise Data Warehouse)

   5.集结区(Staging Area)

   6.展现区(Presentation Area)

 

二.ETL 设计的两条主线:

   1.规划与设计:需求/现状 -> 架构 -> 实现 -> 测试/发布

   2.数据流:抽取 -> 清洗 -> 规格化 -> 提交