10.1数据分组
分组允许吧数据分为多个逻辑组,以便能对每个组进行聚集计算。
10.2创建分组
SELECT vend_id,COUNT(*) AS num_prodsFROM ProductsGROUP BY vend_id;
使用GROUP BY的一些规定:
(1)GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
(2)如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算。
(3)GROUP BY子句中列出的每个列都必须是检索列或有效的表达式。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能用别名。
(4)大多数SQL实现不允许GROUP BY列带有长度可变的数据类型。
(5)除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句给出。
(6)如果分组列种具有NULL值,则NULL将作为一个分组返回。如果列种有多行NULL值,它们将分为一组。
(7)GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。
10.3 过滤分组
WHERE过滤指定的是列而不是分组。事实上WHERE没有分组的概念。
事实上,目前所学过的所有类型的WHERE子句都可以用HAVING来代替。唯一的差别是WHERE过滤行,而HAVING过滤分组。
SELECT cust_id,COUNT(*) AS ordersFROM OrdersGROUP BY cust_idHAVING COUNT(*) >= 2;
HAVING和WHERE的差别:这里有另一种理解方法,WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中,这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。
列出具有两个以上,价格为4以上的产品的供销商
SELECT vend_id,COUNT(*) AS num_prodsFROM ProductsWHERE prod_price >= 4GROUP BY vend_idHAVING COUNT(*) >= 2;
使用HAVING和WHERE:HAVING和WHERE非常类似,如果不指定GROUP BY,则大多数DBMS将把它们作为相同的东西对待。不过,为了自己可以区分,应该仅在与GROUP BY子句结合使用时才使用HAVING,而WHERE子句用于标准的行级过滤。
10.4分组和排序
GROUP BY和ORDER BY的区别
不要忘记ORDER BY:一般在使用GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。
检索包含3个或3个以上物品的订单号和订单物品的数目
SELECT order_num,COUNT(*) AS itemsFROM OrderItemsGROUP BY order_numHAVING COUNT(*) >= 3;
为按订购物品的数目排序输出,需要添加ORDER BY子句
SELECT order_num,COUNT(*) AS itemsFROM OrderItemsGROUP BY order_numHAVING COUNT(*) >= 3ORDER BY items,order_num;