当前位置: 代码迷 >> 数据仓库 >> 怎么入门数据仓库,请关注本贴
  详细解决方案

怎么入门数据仓库,请关注本贴

热度:77   发布时间:2016-05-05 16:07:12.0
如何入门数据仓库,请关注本贴。
大家好,
  看了论坛里的帖子,很多网友对数据仓库如何入门表示困惑。我正好从事这方面的工作,给大家一些关键性的信息,帮助大家梳理一下对数据仓库的认识。

1.数据仓库的概念,你需要都几本书,打开你的视线。
Building the Data Warehouse-作者: W. H. Inmon
参考地址:http://book.douban.com/subject/2667055/
中文版:http://book.douban.com/subject/1881631/

从累计知识上来说,你最少需要读相关书籍一本以上。

2.实践数据仓库,可以肯定的说,你需要有一个数据库环境。安装开源的Mysql,Postgresql都是首选。Oracle,Ms Sql这些商业数据库变化太快,使用方式都是自家一套,你还需要付费购买版权,不推荐。

在数据库的基础之上,你需要掌握的地一套技能就是ETL。工具推荐Pentaho Kettle,JasperSoft Etl,Talend ETL这些开源的工具上。很多朋友都说资料难找,掌握起来不方便。我想提醒你,工具的使用是建立在你的知识结构上的。
实际一点,拿kettle来说,学习如何使用,在下载的包里就是范例。pentaho有WIKI站点提供控件定义,还有健全的用户论坛。当然是英文的,你总不能拿不懂英文当回事。不会就需要改进。

3.掌握OLAP实践,这里还是工具。有了数据之后需要有个好用的模型来查询,就是建立“Cube”(立方体),Pentaho Mondrian就可以做。这里就需要你的JAVA知识了。

4.写前端报表,还是工具,pentaho reporting,http://reporting.pentaho.com/,还是JAVA。你如果不想有限制,也可以自己写一个报表,能不能成看你功力。






------解决方案--------------------
很好。
------解决方案--------------------
好,太好
------解决方案--------------------
领教了
------解决方案--------------------
学习了
------解决方案--------------------
膜拜,刚接触云计算那阵真晕,现在我在戴尔工作
------解决方案--------------------
难度有些大啊
------解决方案--------------------
学习了!
------解决方案--------------------
恩,自己练手可以研究下开源的工具