Spool跟SQLLDR-Oracle数据导出导入（传）_SQL

Spool和SQLLDR--Oracle数据导出导入（传）

对于SPOOL数据的SQL，最好要自己定义格式，以方便程序直接导入,SQL语句如：
select taskindex||'|'||commonindex||'|'||tasktype||'|'||to_number(to_char(sysdate,'YYYYMMDD')) from ssrv_sendsms_task;

spool常用的设置
set colsep' ';　　　 //域输出分隔符
set echo off;　　　　//显示start启动的脚本中的每个sql命令，缺省为on
set feedback off;　　//回显本次sql命令处理的记录条数，缺省为on
set heading off;　　 //输出域标题，缺省为on
set pagesize 0;　　　//输出每页行数，缺省为24,为了避免分页，可设定为0。
set termout off;　　 //显示脚本中的命令的执行结果，缺省为on
set trimout on;　　　//去除标准输出每行的拖尾空格，缺省为off
set trimspool on;　　//去除重定向（spool）输出每行的拖尾空格，缺省为off

导出文本数据的建议格式：
SQL*PLUS环境设置SET NEWPAGE NONE
SET HEADING OFF
SET SPACE 0
SET PAGESIZE 0
SET TRIMOUT ON
SET TRIMSPOOL ON
SET LINESIZE 2500

注：LINESIZE要稍微设置大些，免得数据被截断，它应和相应的TRIMSPOOL结合使用防止导出的文本有太多的尾部空格。但是如果LINESIZE设置太大，会大大降低导出的速度，另外在WINDOWS下导出最好不要用PLSQL导出，速度比较慢，直接用COMMEND下的SQLPLUS命令最小化窗口执行。

对于字段内包含很多回车换行符的应该给与过滤，形成比较规矩的文本文件。通常情况下，我们使用SPOOL方法，将数据库中的表导出为文本文件的时候会采用两种方法，如下述：

方法一：采用以下格式脚本　
set colsep '|' --设置|为列分隔符
　　set trimspool on
　　set linesize 120
　　set pagesize 2000
　　set newpage 1
　　set heading off
　　set term off
set num 18
set feedback off
　　spool 路径+文件名
　　select * from tablename;
　　spool off

方法二：采用以下脚本
set trimspool on
　　set linesize 120
　　set pagesize 2000
　　set newpage 1
　　set heading off
　　set term off
　　spool 路径+文件名
　　select col1||','||col2||','||col3||','||col4||'..' from tablename;
　　spool off

比较以上方法，即方法一采用设定分隔符然后由sqlplus自己使用设定的分隔符对字段进行分割，方法二将分隔符拼接在SELECT语句中，即手工控制输出格式。

在实践中，发现通过方法一导出来的数据具有很大的不确定性，这种方法导出来的数据再由sqlldr导入的时候出错的可能性在95%以上，尤其对大批量的数据表，如100万条记录的表更是如此，而且导出的数据文件狂大。

而方法二导出的数据文件格式很规整，数据文件的大小可能是方法一的1/4左右。经这种方法导出来的数据文件再由sqlldr导入时，出错的可能性很小，基本都可以导入成功。

因此，实践中我建议大家使用方法二手工去控制spool文件的格式，这样可以减小出错的可能性，避免走很多弯路。

自测例：将ssrv_sendsms_task表中的数据导出到文本(数据库Oracle 9i 操作系统 SUSE LINUX Enterprise Server 9)

spool_test.sh脚本如下：
#!/bin/sh
DB_USER=zxdbm_ismp #DB USER
DB_PWD=zxin_smap #DB PASSWORD
DB_SERV=zx10_40_43_133 #DB SERVICE NAME

sqlplus -s $DB_USER/$DB_PWD@$DB_SERV<<EOF # -s 参数屏蔽打印到屏幕上的其他信息，只显示sql执行后从DB中查询出来的信息，过滤掉spool函数执行时在文件中写入的其他信息。
set trimspool on
set linesize 120
set pagesize 2000
set newpage 1
set heading off
set term off
spool promt.txt
select taskindex||'|'||commonindex||'|'||tasktype||'|'||to_number(to_char(sysdate,'YYYYMMDD')) from ssrv_sendsms_task;
spool off
EOF

执行./spool_test.sh后生成sp_test.txt，内容如下：
83|115|1|20080307
85|115|11|20080307
86|115|10|20080307
84|115|2|20080307
6|5|14|20080307
7|5|12|20080307
9|5|15|20080307

注：上面自测例中，spool promt.txt中的目标生成文件promt.txt,在HP-UNX环境下的shell脚本中调用Oracle的spool函数，如果将上述逻辑代码封装为一个function，然后来调用这个function的话，则在shell脚本中最终是不会生成promt.txt文件的。只能直接执行逻辑代码，封装后则spool函数失效。
对于promt.txt在相对路径下，下面2中方法在shell环境中执行时，两者只能择一，两者并存则spool函数会失效。假设promt.txt文件生成的路径为：/home/zxin10/zhuo/batchoperate/spoolfile
方式[1]
echo "start spool in shell.."

sqlplus -s zxdbm_ismp/zxin_smap<<EOF
set pagesize 0
set echo off feed off term off heading off trims off
set colsep '|'
set trimspool on
set linesize 10000
set trimspool on
set linesize 120
set newpage 1
spool /home/zxin10/zhuo/batchoperate/spoolfile/promt.txt
select batchindex||'|'||productid||'|'||contentid||'|'||optype||'|'||uploadfile from zxdbm_700.s700_batch_operation where status=1;
spool off
EOF
echo "end.."
方式[2]
echo "start spool in shell.."
cd /home/zxin10/zhuo/batchoperate/spoolfile
sqlplus -s zxdbm_ismp/zxin_smap<<EOF
set pagesize 0
set echo off feed off term off heading off trims off
set colsep '|'
set trimspool on
set linesize 10000
set trimspool on
set linesize 120
set newpage 1
spool promt.txt
select batchindex||'|'||productid||'|'||contentid||'|'||optype||'|'||uploadfile from zxdbm_700.s700_batch_operation where status=1;
spool off
EOF
echo "end.."

文本如何导入oracle(sqlldr 的用法)
关键词：文本导入 oracle
在命令提示符中输入sqlldr userid=system/manager control='c:\control.ctl',control.clt中的内容是:
load data
infile '要导入的文本文件名'
append into table 表名
fields terminated by ' '
(字段名,字段名,字段名......)
在导入之前必须保证表已经建好
　　sqlldr userid=lgone/tiger control=a.ctl
　　LOAD DATA
　　INFILE 't.dat' // 要导入的文件
　　// INFILE 'tt.date' // 导入多个文件
　　// INFILE * // 要导入的内容就在control文件里下面的BEGINDATA后面就是导入的内容
　　
　　INTO TABLE table_name // 指定装入的表
　　BADFILE 'c:\bad.txt' // 指定坏文件地址
　　
　　************* 以下是4种装入表的方式
　　APPEND // 原先的表有数据就加在后面
　　// INSERT // 装载空表如果原先的表有数据 sqlloader会停止默认值
　　// REPLACE // 原先的表有数据原先的数据会全部删除
　　// TRUNCATE // 指定的内容和replace的相同会用truncate语句删除现存数据
　　
　　************* 指定的TERMINATED可以在表的开头也可在表的内部字段部分
　　FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
　　// 装载这种数据: 10,lg,"""lg""","lg,lg"
　　// 在表中结果: 10 lg "lg" lg,lg
　　// TERMINATED BY X '09' // 以十六进制格式 '09' 表示的
　　// TERMINATED BY WRITESPACE // 装载这种数据: 10 lg lg
　　
　　TRAILING NULLCOLS ************* 表的字段没有对应的值时允许为空
　　
　　************* 下面是表的字段
　　(
　　col_1 , col_2 ,col_filler FILLER // FILLER 关键字此列的数值不会被装载
　　// 如: lg,lg,not 结果 lg lg
　　)
　　// 当没声明FIELDS TERMINATED BY ',' 时
　　// (
　　// col_1 [interger external] TERMINATED BY ',' ,
　　// col_2 [date "dd-mon-yyy"] TERMINATED BY ',' ,
　　// col_3 [char] TERMINATED BY ',' OPTIONALLY ENCLOSED BY 'lg'
　　// )
　　// 当没声明FIELDS TERMINATED BY ','用位置告诉字段装载数据
　　// (
　　// col_1 position(1:2),
　　// col_2 position(3:10),
　　// col_3 position(*:16), // 这个字段的开始位置在前一字段的结束位置
　　// col_4 position(1:16),
　　// col_5 position(3:10) char(8) // 指定字段的类型
　　// )
　　
　　BEGINDATA // 对应开始的 INFILE * 要导入的内容就在control文件里
　　10,Sql,what
　　20,lg,show
　　
　　=====================================================================================
　　//////////// 注意begindata后的数值前面不能有空格
　　
　　1 ***** 普通装载
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
　　(DEPTNO,
　　DNAME,
　　LOC
　　)
　　BEGINDATA
　　10,Sales,"""USA"""
　　20,Accounting,"Virginia,USA"
　　30,Consulting,Virginia
　　40,Finance,Virginia
　　50,"Finance","",Virginia // loc 列将为空
　　60,"Finance",,Virginia // loc 列将为空
　　
　　2 ***** FIELDS TERMINATED BY WHITESPACE 和 FIELDS TERMINATED BY x'09' 的情况
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　FIELDS TERMINATED BY WHITESPACE
　　-- FIELDS TERMINATED BY x'09'
　　(DEPTNO,
　　DNAME,
　　LOC
　　)
　　BEGINDATA
　　10 Sales Virginia
　　
　　3 ***** 指定不装载那一列
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
　　( DEPTNO,
　　FILLER_1 FILLER, // 下面的 "Something Not To Be Loaded" 将不会被装载
　　DNAME,
　　LOC
　　)
　　BEGINDATA
　　20,Something Not To Be Loaded,Accounting,"Virginia,USA"
　　
　　4 ***** position的列子
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　( DEPTNO position(1:2),
　　DNAME position(*:16), // 这个字段的开始位置在前一字段的结束位置
　　LOC position(*:29),
　　ENTIRE_LINE position(1:29)
　　)
　　BEGINDATA
　　10Accounting Virginia,USA
　　
　　5 ***** 使用函数日期的一种表达 TRAILING NULLCOLS的使用
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　FIELDS TERMINATED BY ','
　　TRAILING NULLCOLS // 其实下面的ENTIRE_LINE在BEGINDATA后面的数据中是没有直接对应
　　// 的列的值的如果第一行改为 10,Sales,Virginia,1/5/2000,, 就不用TRAILING NULLCOLS了
　　(DEPTNO,
　　DNAME "upper(:dname)", // 使用函数
　　LOC "upper(:loc)",
　　LAST_UPDATED date 'dd/mm/yyyy', // 日期的一种表达方式还有'dd-mon-yyyy' 等
　　ENTIRE_LINE ":deptno||:dname||:loc||:last_updated"
　　)
　　BEGINDATA
　　10,Sales,Virginia,1/5/2000
　　20,Accounting,Virginia,21/6/1999
　　30,Consulting,Virginia,5/1/2000
　　40,Finance,Virginia,15/3/2001
　　
　　6 ***** 使用自定义的函数 // 解决的时间问题
　　create or replace
　　function my_to_date( p_string in varchar2 ) return date
　　as
　　type fmtArray is table of varchar2(25);
　　
　　l_fmts fmtArray := fmtArray( 'dd-mon-yyyy', 'dd-month-yyyy',
　　'dd/mm/yyyy',
　　'dd/mm/yyyy hh24:mi:ss' );
　　l_return date;
　　begin
　　for i in 1 .. l_fmts.count
　　loop
　　begin
　　l_return := to_date( p_string, l_fmts(i) );
　　exception
　　when others then null;
　　end;
　　EXIT when l_return is not null;
　　end loop;
　　
　　if ( l_return is null )
　　then
　　l_return :=
　　new_time( to_date('01011970','ddmmyyyy') + 1/24/60/60 *
　　p_string, 'GMT', 'EST' );
　　end if;
　　
　　return l_return;
　　end;
　　/
　　
　　LOAD DATA
　　INFILE *
　　INTO TABLE DEPT
　　REPLACE
　　FIELDS TERMINATED BY ','
　　TRAILING NULLCOLS
　　(DEPTNO,
　　DNAME "upper(:dname)",
　　LOC "upper(:loc)",
　　LAST_UPDATED "my_to_date( :last_updated )" // 使用自定义的函数
　　)
　　BEGINDATA
　　10,Sales,Virginia,01-april-2001
　　20,Accounting,Virginia,13/04/2001
　　30,Consulting,Virginia,14/04/2001 12:02:02
　　40,Finance,Virginia,987268297
　　50,Finance,Virginia,02-apr-2001
　　60,Finance,Virginia,Not a date
　　
　　7 ***** 合并多行记录为一行记录
　　LOAD DATA
　　INFILE *
　　concatenate 3 // 通过关键字concatenate 把几行的记录看成一行记录
　　INTO TABLE DEPT
　　replace
　　FIELDS TERMINATED BY ','
　　(DEPTNO,
　　DNAME "upper(:dname)",
　　LOC "upper(:loc)",
　　LAST_UPDATED date 'dd/mm/yyyy'
　　)
　　BEGINDATA
　　10,Sales, // 其实这3行看成一行 10,Sales,Virginia,1/5/2000
　　Virginia,
　　1/5/2000
　　// 这列子用 continueif list="," 也可以
　　告诉sqlldr在每行的末尾找逗号找到逗号就把下一行附加到上一行
　　
　　LOAD DATA
　　INFILE *
　　continueif this(1:1) = '-' // 找每行的开始是否有连接字符 - 有就把下一行连接为一行
　　// 如 -10,Sales,Virginia,
　　// 1/5/2000 就是一行 10,Sales,Virginia,1/5/2000
　　// 其中1:1 表示从第一行开始并在第一行结束还有continueif next 但continueif list最理想
　　INTO TABLE DEPT
　　replace
　　FIELDS TERMINATED BY ','
　　(DEPTNO,
　　DNAME "upper(:dname)",
　　LOC "upper(:loc)",
　　LAST_UPDATED date 'dd/mm/yyyy'
　　)
　　BEGINDATA // 但是好象不能象右面的那样使用
　　-10,Sales,Virginia, -10,Sales,Virginia,
　　1/5/2000 1/5/2000
　　-40, 40,Finance,Virginia,13/04/2001
　　Finance,Virginia,13/04/2001
　　
　　8 ***** 载入每行的行号
　　
　　load data
　　infile *
　　into table t
　　replace
　　( seqno RECNUM //载入每行的行号
　　text Position(1:1024))
　　BEGINDATA
　　fsdfasj //自动分配一行号给载入表t 的seqno字段此行为 1
　　fasdjfasdfl // 此行为 2