数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策
?
------------------------------------------------
数据仓库与传统数据库区别
?
?
数据生命为5-10年,反之60-90天
?
数据为每天的复制快照,不能更新,反之包含当前值,可更新
?
?
数据总是包含某时间元素,反之可包含也可不包含
?
--------------------------------------------------
?
数据粒度,粒度的双重级别
?
数据分割,小数据块容易建立索引,扫描,恢复,监控
按照1.时间 2.商业线 3.地理位置 4.组织单位
?
数据仓库中的数据组织:
简单堆积 ? 按天的统计堆积
轮转综合 ? 按天,按周,按月统计堆积
简单直接 ? 按天统计,按月连接
连续 ? ? ? 同上,连接连续文件
?
数据仓库清理:
数据进入轮转综合文件
转到大容量介质上
数据清除
数据转移层