- ETL:ETL是用来描述将数据从源端经过提取、转换、装入到目的端的过程。ETL是构建数据仓库的重要一环,它包含了三个方面,首先是“抽取”,将数据从各种原始的业务系统中读取出来,这是所有工作的前提。其次是“转换”,按照预先设计好的规则将抽取的数据进行转换,使本来异构的数据格式能统一起来。最后是“装载”,将转换完的数据按计划增量或全部导入到数据仓库中。
- 常用ETL工具:
- ETL工具的典型代表有Informatica PowerCenter、IBM Datastage、Oracle Warehouse Builder(OWB)、Oracle Data Integrator(ODI)、Microsoft SQL Server Integration Services及开源的Kettle。
- Kettle允许用户管理来自不同数据库的数据,它有两种脚本文件:transformation和job。transformation完成针对数据的基础转换,job则完成整个工作流的控制。Kettle目前包括以下几个产品:
- (1)Chef:可使用户创建任务(Job)。它是提供图形用户界面的工作设计工具。
- (2)Kitchen:可使用户批量使用由Chef设计的任务,一般在自动调度时借助此命令调用调试成功的任务。它是一个后台运行的程序,以命令行方式,没有图形用户界面。
- (3)Spoon:可使用户通过图形界面来设计ETL转换过程,一般在编写和调试ETL时用到。
- (4)Span:可使用户批量运行由Spoon设计的ETL转换,Span是一个后台执行的程序,以命令行方式,没有图形界面,一般在自动调度时借助此命令调用调试成功的转换。
- 实例:使用Kettle将MySQL数据库中的数据表迁移到Oracle数据库中。
详细解决方案
什么是ETL、Kettle,Kettle数据迁移、常用ETL工具
热度:49 发布时间:2023-12-11 15:50:38.0
相关解决方案
- kettle 的数据转移解决方法
- 此外一个神奇的ETL工具,KETTLE
- kettle 创设任务定时执行数据抽取
- kettle 抽取数据时连接重置Connection reset
- Kettle 3.2 联接 SQL Server 2008
- kettle 3.2联接MSSQL 2000时,提示:Unable to get information from SQL Server
- kettle 中oralce的 left join 如何实现
- kettle 的数据转移解决方案
- kettle Job日志有关问题 100分!
- kettle 的数据转移,该如何处理
- Kettle ETL工具如何把sql显示出来
- kettle 导入 HDFS Hive读取中文乱码
- Pentaho Kettle 6.1连接CDH5.4.0集群
- Kettle— 使用手册和ckettle也可以参考使用
- kettle bat文件启动带参数
- kettle 安装
- kettle 使用说明
- Pentaho Kettle 8.1 使用 Mysql 8.0 开启 Reposity 模式
- Kettle Number BigNumber Format
- Kettle 中的 filenames result 系统
- Pentaho Kettle 连接 CDH Hive (No suitable driver found for jdbc:hive2 错误解决方法)
- Pentahou Kettle 在Job里使用Javascript 处理复杂逻辑
- Pentaho Kettle 连 Oracle (SID)
- Pentaho Kettle 连接 Hive2 进行 ETL 的总结
- Pentaho Kettle 简单并行处理
- Kettle (PDI) 连接 MS SQL server数据库
- Kettle 连 Salesforce 拉数据
- Kettle 中常用 控件一览
- Kettle 和 SSIS 的区别研究 (Kettle 循环遍历)
- 什么是ETL、Kettle,Kettle数据迁移、常用ETL工具