数据仓库是一个将源系统数据抽取、清洗、规格化、提交到维度数据存储的系统,为
决策的制定提供查询和分析功能的支撑与实现.
一.数据仓库中的常见术语:
1.数据仓库(Data Warehouse)
2.数据集市(Data Mart)
3. 操作型数据存储(ODS,Operational Data Store)
4.企业数据仓库(EDW,Enterprise Data Warehouse)
5.集结区(Staging Area)
6.展现区(Presentation Area)
二.ETL 设计的两条主线:
1.规划与设计:需求/现状 -> 架构 -> 实现 -> 测试/发布
2.数据流:抽取 -> 清洗 -> 规格化 -> 提交