当前位置: 代码迷 >> SQL >> 拔高SQL效率
  详细解决方案

拔高SQL效率

热度:98   发布时间:2016-05-05 14:03:45.0
提高SQL效率

?

下面就某些SQL 语句的 where 子句编写中需要注意的问题作详细介绍。在这些 where 子句中,即使某些列存在索引,但是由于编写了劣质的 SQL ,系统在运行该 SQL 语句时也不能使用该索引,而同样使用全表扫描,这就造成了响应速度的极大降低。?

1.?IS?NULL?与? IS?NOT?NULL?

不能用null 作索引,任何包含 null 值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只要这些列中有一列含有 null ,该列就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也不会提高性能。?

任何在where 子句中使用 is?null is?not?null 的语句优化器是不允许使用索引的。?

2.?联接列?

对于有联接的列,即使最后的联接值为一个静态值,优化器是不会使用索引的。我们一起来看一个例子,假定有一个职工表(employee ),对于一个职工的姓和名分成两列存放( FIRST_NAME LAST_NAME ),现在要查询一个叫比尔 . 克林顿( Bill?Cliton )的职工。?

下面是一个采用联接查询的SQL 语句,?

select?*?from?employss?
where?
first_name||'||last_name?='Beill?Cliton'?

上面这条语句完全可以查询出是否有Bill?Cliton 这个员工,但是这里需要注意,系统优化器对基于 last_name 创建的索引没有使用。?

当采用下面这种SQL 语句的编写, Oracle 系统就可以采用基于 last_name 创建的索引。?

Select?*?from?employee?

where?

first_name?='Beill'?and?last_name?='Cliton'?

遇到下面这种情况又如何处理呢?如果一个变量(name )中存放着 Bill?Cliton 这个员工的姓名,对于这种情况我们又如何避免全程遍历,使用索引呢?可以使用一个函数,将变量 name 中的姓和名分开就可以了,但是有一点需要注意,这个函数是不能作用在索引列上。下面是 SQL 查询脚本:?

select?*?from?employee?

where?

first_name?=?SUBSTR('&&name',1,INSTR('&&name','?')-1)?

and?

last_name?=?SUBSTR('&&name',INSTR('&&name’,'?')+1)?

3.?带通配符( % )的 like 语句?

同样以上面的例子来看这种情况。目前的需求是这样的,要求在职工表中查询名字中包含cliton 的人。可以采用如下的查询 SQL 语句:?

select?*?from?employee?where?last_name?like?'%cliton%'?

这里由于通配符(% )在搜寻词首出现,所以 Oracle 系统不使用 last_name 的索引。在很多情况下可能无法避免这种情况,但是一定要心中有底,通配符如此使用会降低查询速度。然而当通配符出现在字符串其他位置时,优化器就能利用索引。在下面的查询中索引得到了使用:?

select?*?from?employee?where?last_name?like?'c%'?

4.?Order?by语句 ?

ORDER?BY语句决定了 Oracle 如何将返回的查询结果排序。 Order?by 语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。任何在 Order?by 语句的非索引项或者有计算表达式都将降低查询速度。?

仔细检查order?by 语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写 order?by 语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在 order?by 子句中使用表达式。?

5.?NOT?

我们在查询时经常在where 子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可以使用 and (与)、 or (或)以及 not (非)。 NOT 可用来对任何逻辑运算符号取反。下面是一个 NOT 子句的例子:?

...?where?not?(status?='VALID')?

如果要使用NOT ,则应在取反的短语前面加上括号,并在短语前面加上 NOT 运算符。 NOT 运算符包含在另外一个逻辑运算符中,这就是不等于( <>; )运算符。换句话说,即使不在查询 where 子句中显式地加入 NOT 词, NOT 仍在运算符中,见下例:?

...?where?status?<>;'INVALID'?

再看下面这个例子:?

select?*?from?employee?where?salary<>;3000;?

对这个查询,可以改写为不使用NOT :?

select?*?from?employee?where?salary<3000?or?salary>;3000;?

虽然这两种查询的结果一样,但是 第二种查询方案会比第一种查询方案更快些 。第二种查询允许Oracle salary 列使用索引,而第一种查询则不能使用索引。?

6.?IN EXISTS?

有时候会将一列和一系列值相比较。最简单的办法就是在where 子句中使用子查询。在 where 子句中可以使用两种格式的子查询。?

第一种格式是使用IN 操作符:?

...?where?column?in(select?*?from?...?where?...);?

第二种格式是使用EXIST 操作符:?

...?where?exists?(select?'X'?from?...where?...);?

我相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效率高。在Oracle 中可以几乎将所有的 IN 操作符子查询改写为使用 EXISTS 的子查询。?

第二种格式中,子查询以‘select?'X' 开始。运用 EXISTS 子句不管子查询从表中抽取什么数据它只查看 where 子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在 where 语句中使用的列存在索引)。相对于 IN 子句来说, EXISTS 使用相连子查询,构造起来要比 IN 子查询困难一些。?

通过使用EXIST Oracle 系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。 Oracle 系统在执行 IN 子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用 EXISTS 比使用 IN 通常查询速度快的原因。?

同时应尽可能使用NOT?EXISTS 来代替 NOT?IN ,尽管二者都使用了 NOT (不能使用索引而降低速度), NOT?EXISTS 要比 NOT?IN 查询效率更高。

?

?

?

?

==============================另外的一篇文章===============================================

基本的Sql编写注意事项

  • 尽量少用IN操作符,基本上所有的IN操作符都可以用EXISTS代替。
  • 不用NOT IN操作符,可以用NOT EXISTS或者外连接+替代。
  • Oracle在执行IN子查询时,首先执行子查询,将查询结果放入临时表再执行主查询。而EXIST则是首先检查主查询,然后运行子查询直到找到第一个匹配项。NOT EXISTS比NOT IN效率稍高。但具体在选择IN或EXIST操作时,要根据主子表数据量大小来具体考虑。
  • 不用“<>”或者“!=”操作符。对不等于操作符的处理会造成全表扫描,可以用“<” or “>”代替。
  • Where子句中出现IS NULL或者IS NOT NULL时,Oracle会停止使用索引而执行全表扫描。可以考虑在设计表时,对索引列设置为NOT NULL。这样就可以用其他操作来取代判断NULL的操作。
  • ?

  • 当通配符“%”或者“_”作为查询字符串的第一个字符时,索引不会被使用。
  • 对于有连接的列“||”,最后一个连接列索引会无效。尽量避免连接,可以分开连接或者使用不作用在列上的函数替代。
  • 如果索引不是基于函数的,那么当在Where子句中对索引列使用函数时,索引不再起作用。
  • Where子句中避免在索引列上使用计算,否则将导致索引失效而进行全表扫描。
  • 对数据类型不同的列进行比较时,会使索引失效。
  • 用“>=”替代“>”。
  • UNION操作符会对结果进行筛选,消除重复,数据量大的情况下可能会引起磁盘排序。如果不需要删除重复记录,应该使用UNION ALL。
  • Oracle从下到上处理Where子句中多个查询条件,所以表连接语句应写在其他Where条件前,可以过滤掉最大数量记录的条件必须写在Where子句的末尾。
  • Oracle从右到左处理From子句中的表名,所以在From子句中包含多个表的情况下,将记录最少的表放在最后。(只在采用RBO优化时有效,下文详述)
  • Order By语句中的非索引列会降低性能,可以通过添加索引的方式处理。严格控制在Order By语句中使用表达式。
  • 不同区域出现的相同的Sql语句,要保证查询字符完全相同,以利用SGA共享池,防止相同的Sql语句被多次分析。
  • 多利用内部函数提高Sql效率。
  • 当在Sql语句中连接多个表时,使用表的别名,并将之作为每列的前缀。这样可以减少解析时间。

需要注意的是,随着Oracle的升级,查询优化器会自动对Sql语句进行优化,某些限制可能在新版本的Oracle下不再是问题。尤其是采用CBO(Cost-Based Optimization,基于代价的优化方式)时。

我们可以总结一下可能引起全表扫描的操作:

  • 在索引列上使用NOT或者“<>”;
  • 对索引列使用函数或者计算;
  • NOT IN操作;
  • 通配符位于查询字符串的第一个字符;
  • IS NULL或者IS NOT NULL;
  • 多列索引,但它的第一个列并没有被Where子句引用;

Oracle优化器

Oracle优化器(Optimizer)是Oracle在执行SQL之前分析语句的工具。
Oracle的优化器有两种优化方式:基于规则的(RBO)和基于代价的(CBO)。

  • RBO: 优化器遵循Oracle内部预定的规则。
  • CBO: 依据语句执行的代价,主要指对CPU和内存的占用。优化器在判断是否使用CBO时,要参照表和索引的统计信息。统计信息要在对表做analyze后才会有。Oracle8及以后版本,推荐用CBO方式。

Oracle优化器的优化模式主要有四种:

  • Rule:基于规则;
  • Choose:默认模式。根据表或索引的统计信息,如果有统计信息,则使用CBO方式;如果没有统计信息,相应列有索引,则使用RBO方式。
  • First rows:与Choose类似。不同的是如果表有统计信息,它将以最快的方式返回查询的前几行,以获得最佳响应时间。
  • All rows:即完全基于Cost的模式。当一个表有统计信息时,以最快方式返回表所有行,以获得最大吞吐量。没有统计信息则使用RBO方式。

设定优化模式的方式

  • Instance级别:在init<SID>.ora文件中设定OPTIMIZER_MODE;
  • Session级别:通过SQL> ALTER SESSION SET OPTIMIZER_MODE=;来设定。
  • 语句级别:通过SQL> SELECT /*+ALL+_ROWS*/ ……;来设定。可用的HINT包括/*+ALL_ROWS*/、/*+FIRST_ROWS*/、/*+CHOOSE*/、/*+RULE*/ 等。

要注意的是,如果表有统计信息,则可能造成语句不走索引的结果。可以用SQL>ANALYZE TABLE table_name DELETE STATISTICS; 删除索引。
对列和索引更新统计信息的SQL:
SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;
SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;

  相关解决方案