补充一下,我们之前调研过的一个ETL开源项目是 Kettle,这个应该没有CR-X那么强大,还支持流式数据(streaming)
KETTLE
Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 这个ETL的开源项目的名称,很有意思,直译中文为“水壶”。按项目负责人Matt的说法:把各种数据发到一个壶里,然后呢,以一种你希望的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。 作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。